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奇数 编号 练习 题 答案 
为 了 方便 学 生 使 用 ， 本 书 网 站 上 提供 了 所 有 奇数 编号 复习 题 和 练习 题 的 答案 。 


如 何 使 用 本 书 


本 书 的 章节 组 织 灵活 ， 建 议 按 以 下 指南 学 习 : 

。 第 1 一 8 章 内 容 对 理解 本 书 其 余 内 容 而 言 是 必要 的 。 

。 如 果 时 间 允 许 ， 可 以 教授 第 9 一 14 章 内 容 。 在 学 季 制 中 这 些 内 容 可 以 省 去 。 
。 第 15 一 20 章 内 容 应 该 基于 学 生 的 专业 和 教师 的 判断 有 选择 地 教授 。 
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Foundations of Computer Scicnce, Fourth Edition 


党 一: 二 队 


今天 ， 计 算 机 科学 一 词 是 一 个 非常 广泛 的 概念 。 然 而 在 本 书 中 ， 我 们 将 其 定义 为 “和 计 
算 机 相关 的 问题 ”。 本 章 首先 阐述 什么 是 计算 机 ， 接 着 探索 和 计算 机 直接 相关 的 一 些 问题 。 
本 章 首 先 会 将 计算 机 视 为 图 灵 模 型 ， 这 是 从 数学 和 哲学 上 对 计算 的 定义 。 接 着 会 阐明 当 今 的 “ 
计算 机 是 如 何 建立 在 冯 . 诺 依 曼 模型 基础 之 上 的 。 本 章 的 最 后 会 介绍 计算 机 这 一 改变 文明 的 
机 器 的 简要 历史 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 定义 计算 机 的 图 灵 模 型 ; 

。 定义 计算 机 的 汉 … 诺 依 曼 模型 ，; 

。 描述 计算 机 的 三 大 部 分 一 一 硬件 、 数 据 和 软件 ; 

。 列举 与 计算 机 硬件 相关 的 话题 ， 

。 列举 与 数据 相关 的 话题 ; 

。 列举 与 软件 相关 的 话题 ; 

。 说 出 计算 机 的 简明 历史 。 


1.1 图 灵 模 型 

Alan Turing (阿兰 . 图 灵 ) 在 1936 年 最 先 提出 了 一 个 通用 计算 设备 的 设想 。 他 认为 ， 
所 有 的 计算 都 可 以 在 一 种 特殊 的 机 器 上 执行 ， 这 就 是 现在 所 说 的 图 灵机 。 尽 管 图 灵 对 这 样 一 
种 机 器 进行 了 数学 上 的 描述 ， 但 他 还 是 更 有 兴趣 关注 计算 的 哲学 定义 ， 而 不 是 建造 一 台 真实 
的 机 器 。 他 将 该 模型 建立 在 人 们 进行 计算 过 程 的 行为 上 ， 并 将 这 些 行为 抽象 到 用 于 计算 的 机 
器 的 模型 中 ， 这 才 真 正 改变 了 世界 。 


1.1.1 数据 处 理 器 


在 讨论 图 灵 模 型 之 前 ， 让 我 们 把 计算 机 定义 成 一 个 数据 处 理 器 。 依 照 这 种 定义 ， 计 算 机 
可 以 被 看 作 一 个 接受 输入 数据 、 处 理 数据 并 产生 输出 数据 的 黑 盒 (如 图 1-1 所 示 )。 尽 管 这 
个 模型 能 够 体现 现代 计算 机 的 功能 ， 但 是 它 的 定义 
还 是 太 宽泛 。 按 照 这 种 定义 ， 也 可 以 认为 便携 式 计 输入 数据 输出 数据 
算 器 是 计算 机 (按照 字面 意思 ， 它 也 符合 定义 的 
图 1-1 一 个 单 用 途 计 算 机 器 


模型 )。 
另 一 个 问题 是 这 个 模型 并 没有 说 明 它 处 理 的 类 型 以 及 是 否 可 以 处 理 一 种 以 上 的 类 型 。 换 


句 话说 ， 它 并 没有 清楚 地 说 明基 于 这 个 模型 的 机 器 能 够 完成 操作 的 类 型 和 数量 。 它 是 专用 机 
器 还 是 通用 机 器 呢 ? 

这 种 模型 可 以 表示 为 一 种 设计 用 来 完成 特定 任务 的 专用 计算 机 (或 者 处 理 器 )， 比 如 用 
来 控制 建筑 物 温度 或 汽车 油料 使 用 。 尽 管 如 此 ， 计 算 机 作为 一 个 当今 使 用 的 术语 ， 是 一 种 通 


2 常委 


用 的 机 器 ， 它 可 以 完成 各 种 不 同 的 工作 。 这 表明 我 们 需要 将 该 模型 改变 为 图 灵 模 型 来 反映 当 
今 计 算 机 的 现实 。 


1.1.2 ”可 编程 数据 处 理 器 

图 灵 模 型 是 一 个 适用 于 通用 计算 机 的 更 好 的 模型 。 该 模型 添加 了 一 个 额外 的 元 素 一 一 
程序 一 一 到 不 同 的 计算 机 器 中 。 程 序 是 用 来 告诉 计算 机 如 何 对 数据 进行 处 理 的 指令 集合 。 图 
1-2 显示 了 图 灵 模 型 。 


输入 数据 
图 1-2 基于 图 灵 模 型 的 计算 机 : 可 编程 数据 处 理 器 


在 这 个 图 灵 模 型 中 ， 输 出 数据 依赖 于 两 方面 因素 的 结合 作用 : 输入 数据 和 程序 。 对 于 相 
同 的 输入 数据 ， 如 果 改 变 程 序 ， 则 可 以 产生 不 同 的 输出 。 类 似 地 ， 对 于 同样 的 程序 ， 如 果 改 
变 输入 数据 ， 其 输出 结果 也 将 不 同 。 最 后 ， 如 果 输 入 数据 和 程序 保持 不 变 ， 输 出 结果 也 将 不 
变 。 让 我 们 看 看 下 面 三 个 示例 。 

1. 相同 的 程序 ， 不 同 的 输入 数据 

图 1-3 显示 了 对 于 同样 的 程序 输入 不 同 的 数据 时 ， 尽 管 程序 相同 ,但 因为 处 理 的 输入 数 
据 不 同 ， 输 出 也 就 不 同 。 

2. 相同 的 输入 数据 ， 不 同 的 程序 

图 1-4 显示 了 程序 不 同 而 输入 数据 相同 时 的 情形 。 每 个 程序 使 计算 机 对 于 相同 的 输入 数 
据 执 行 不 同 的 操作 。 第 一 个 程序 是 使 输入 数据 按 大 小 顺序 排列 ， 第 二 个 程序 是 使 所 有 的 数据 
相 加 ， 第 三 个 程序 是 找 出 输入 数据 中 最 小 的 数 。 








输出 数据 
图 1-3 相同 的 程序 ， 不 同 的 输入 数据 图 1-4 相同 的 输入 数据 ， 不 同 的 程序 


3. 相同 的 输入 数据 ， 相 同 的 程序 
我 们 希望 无 论 何 时 对 于 同样 的 输入 数据 和 程序 ， 其 输出 结果 一 致 。 换 句 话说 ， 当 输入 相 


同 的 数据 运行 程序 时 ， 我 们 希望 有 相同 的 输出 。 


1.1.3 通用 图 灵机 

通用 图 灵机 是 对 现代 计算 机 的 首次 描述 ， 只 要 提供 了 合适 的 程序 ， 该 机 器 就 能 做 任何 运 
算 。 可 以 证 明 ， 一 台 很 强大 的 计算 机 和 通用 图 灵机 一 样 能 进行 同样 的 运算 。 我 们 所 需要 的 仅 
仅 是 为 这 两 者 提供 数据 以 及 用 于 描述 如 何 做 运算 的 程序 。 实 际 上 ， 通 用 图 灵机 能 做 任何 可 计 
算 的 运算 。 


1.2 ” 冯 ，' 诺 依 曼 模型 

基于 通用 图 灵机 建造 的 计算 机 都 是 在 存储 器 中 存储 数据 。 在 1944 一 1945 年 ， 冯 “ 诺 依 
曼 指出 ， 鉴 于 程序 和 数据 在 逻辑 上 是 相同 的 ， 因 此 程序 也 能 存储 在 计算 机 的 存储 器 中 。 
1.2.1 4 个 子 系统 


基于 冯 “, 诺 依 曼 模型 建造 的 计算 机 分 为 4 个 子 系统 : 存储 器 、 算 术 逻 辑 单 元 、 控 制 单元 
和 输入 /输出 〈 见 图 1-5 )。 


输出 数据 
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1-5 冯 ， 诺 依 曼 模 型 


1. 存储 宫 
存储 器 是 用 来 存储 的 区 域 ， 在 计算 机 的 处 理 过 程 中 存储 器 用 来 存储 数据 和 程序 ， 我 们 将 
在 本 章 后 面 讨论 存储 数据 和 程序 的 原因 。 


2. 算术 逻辑 单元 
算术 逻辑 单元 (ALU) 是 用 来 进行 计算 和 逻辑 运算 的 地 方 。 如 果 是 一 台数 据 处 理 计 算 


机 ， 它 应 该 能 够 对 数据 进行 算术 运算 (例如 进行 一 系列 的 数字 相 加 运算 )。 当 然 它 也 应 该 可 
以 对 数据 进行 一 系列 逻辑 运算 ， 正 如 我 们 将 在 第 4 章 看 到 的 那样 。 

3. 控制 单元 

控制 单元 是 对 存储 器 、 算 术 逻 辑 单元 、 输入 /输出 等 子 系统 进行 控制 操作 的 单元 。 

4. 输入 / 输出 

输入 子 系统 负责 从 计算 机 外 部 接收 输入 数据 和 程序 ， 输 出 子 系统 负责 将 计算 机 的 处 理 
结果 输出 到 计算 机 外 部 。 输 入 /输出 子 系统 的 定义 相当 宽泛 ， 它 们 还 包含 辅助 存储 设备 ， 例 
如 ， 用 来 存储 处 理 所 需 的 程序 和 数据 的 磁盘 和 磁带 等 。 当 一 个 磁盘 用 于 存储 处 理 后 的 输出 结 
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果 时 ,我们 一 般 就 可 以 认为 它 是 输出 设备 ， 如 果 从 该 磁盘 上 读 取 数据 ， 则 该 磁盘 就 被 认为 是 
输入 设备 。 


1.2.2 存储 程序 概念 
冯 “' 庄 依 曼 模 型 要 求 程序 必须 存储 在 存储 器 中 。 这 和 早期 只 有 数据 才能 存储 在 存储 器 
中 的 计算 机 结构 完全 不 同 。 完 成 某 一 任务 的 程序 是 通过 操作 一 系列 的 开关 或 改变 其 配 线 来 实 


现 的 。 
现代 计算 机 的 存储 器 用 来 存储 程序 及 其 相应 数据 。 这 意味 着 数据 和 程序 应 该 具有 相同 的 


格式 ， 这 是 因为 它们 都 存储 在 存储 器 中 。 实 际 上 它们 都 是 以 位 模式 (0 和 1 序列 ) 存储 在 存 
储 器 中 的 。 


1.2.3 ”指令 的 顺序 执行 

冯 ， 诺 依 曼 模型 中 的 一 段 程序 由 一 组 数量 有 限 的 指令 组 成 。 按 照 这 个 模型 ， 控 制 单元 从 
存储 器 中 提取 一 条 指令 ， 解 释 指令 ， 接 着 执行 指令 。 换 句 话 说， 指令 就 是 一 条 接着 一 条 地 顺 
序 执行 ， 当 然 ， 一 条 指令 可 能 会 请 求 控制 单元 以 便 跳 转 到 其 前 面 或 者 后 面 的 指令 去 执行 ,但 
是 这 并 不 意味 着 指令 没有 按照 顺序 来 执行 。 指 令 的 顺序 执行 是 基于 冯 : 诺 依 曼 模型 的 计算 机 
的 初始 条 件 。 当 今 的 计算 机 以 最 高 效 的 顺序 来 执行 程序 。 


1.3 ”计算 机 组 成 部 分 
我 们 可 以 认为 计算 机 由 三 大 部 分 组 成 : 计算 机 硬件 、 数 据 和 计算 机 软件 。 


1.3.1 计算 机 硬件 


当今 的 计算 机 硬件 基于 汉 … 诺 依 曼 模型 ， 且 包含 四 部 分 ， 尽 管 可 以 有 不 同类 型 的 存储 
人 证， 不 同类 型 的 输入 /输出 子 系统 等 。 在 第 5 章 我 们 将 详细 讨论 计算 机 硬件 。 


1.3.2 ”数据 
冯 “' 诸 依 曼 模 型 清楚 地 将 一 台 计 算 机 定义 为 一 台数 据 处 理 机 。 它 接收 输入 数据 ， 处 理 并 


输出 相应 的 结果 。 

1. 存储 数据 

冯 ' 诺 依 曼 模 型 并 没有 定义 数据 如 何 存储 在 计算 机 中 。 如 果 一 台 计 算 机 是 一 台电 子 设 
备 ， 最 好 的 数据 存储 方式 应 该 是 电子 信号 ， 例 如 以 电子 信号 的 出 现 和 消失 的 特定 方式 来 存储 
数据 ， 这 意味 着 一 台 计算 机 可 以 以 两 种 状态 之 一 的 形式 来 存储 数据 。 

显然 ， 日 党 使 用 的 数据 并 不 是 以 两 种 状态 之 一 的 形式 存在 的 。 例 如 ， 我 们 在 数字 系统 中 
使 用 的 数字 可 以 是 0 一 9 十 种 状态 中 的 任何 一 个 。 但 是 你 不 能 (至少 到 目前 为 止 ) 将 这 类 信 
息 存储 到 计算 机 内 部 ， 除 非 将 这 类 信息 变换 成 另 一 种 只 使 用 两 种 状态 (0 和 1 ) 的 系统 。 同 
样 ， 你 也 需要 处 理 其 他 类 型 的 数据 (例如 文本 、 图 像 、 声 音 、 视 频 )， 它 们 同样 不 能 直接 存 
储 到 计算 机 中 ， 除 非 将 它们 转变 成 合适 的 形式 (0 和 !1 序列)。 

在 第 3 章 中 ,我 们 将 会 了 解 不 同类 型 的 数据 是 怎样 以 0 和 1 序列 的 二 进 制 形式 存储 在 计 
算 机 内 部 的 。 第 4 章 将 介绍 在 计算 机 内 部 由 二 进 制 组 成 的 数据 是 怎样 被 操作 的 。 


2. 组 织 数据 

尽管 数据 只 能 以 一 种 形式 (位 模式 ) 存储 在 计算 机 内 部 ， 但 在 计算 机 外 部 却 可 以 表现 为 
不 同 的 形式 。 另 外 ， 计 算 机 (以 及 数据 处 理 表 示 法 ) 开创 了 一 个 新 兴 的 研究 领域 一 一 数据 组 
织 。 在 将 数据 存储 到 计算 机 中 之 前 ， 能 和 否 有 效 地 将 数据 组 织 成 不 同 的 实体 和 格式 ? 如 今 ， 数 
据 并 不 是 按照 杂乱 无 章 的 次 序 来 组 织 信息 的 。 数 据 被 组 织 成 许多 小 的 单元 ， 再 由 这 些小 的 单 
元 组 成 更 大 的 单元 ， 等 等 。 在 第 11 一 14 章 中 ， 我 们 将 会 从 这 个 角度 去 认识 数据 。 


1.3.3 ”计算 机 软件 


图 灵 或 汉 “' 诺 依 曼 模型 的 主要 特征 是 程序 的 概念 。 尽 管 早期 的 计算 机 并 没有 在 计算 机 的 
存储 器 中 存储 程序 ， 但 它们 还 是 使 用 了 程序 的 概念 。 编 程 在 早期 的 计算 机 中 体现 为 一 系列 开 
关 的 打开 或 闭合 以 及 配 线 的 改变 。 编 程 在 数据 实际 开始 处 理 之 前 是 由 操作 员 或 工程 师 完成 的 
一 项 工作 。 

1. 程序 必须 是 存储 的 

在 汉 “' 诺 依 曼 模 型 中 ， 这 些 程序 被 存储 在 计算 机 的 存储 器 中 ， 存 储 器 中 不 仅 要 存储 数 
据 ， 还 要 存储 程序 ( 见 图 1-6 )。 

2. 指令 的 序列 

这 个 模型 还 要 求 程序 必须 是 有 序 的 指令 集 。 每 一 条 指令 操作 一 个 或 多 个 数据 项 。 因 此 ， 
一 条 指令 可 以 改变 它 前 面 指令 的 作用 。 例 如 ， 图 1-7 显示 了 一 个 输入 两 个 数据 ， 将 它们 相 





图 1-6 存储 器 中 的 程序 和 数据 图 1-7 由 指令 构成 的 程序 

也 许 我 们 会 问 : 为 什么 程序 必须 由 不 同 的 指令 集 组 成 ? 答案 是 重用 性 。 如 今 ， 计 算 机 完 
成 成 千 上 万 的 任务 ， 如 果 每 一 项 任务 的 程序 都 是 相对 独立 的 ， 且 和 其 他 程序 之 间 没 有 任何 的 
公用 段 ， 编 程 将 会 变 成 一 件 很 困难 的 事情 。 图 灵 模 型 和 冯 “' 诺 依 曼 模型 通过 仔细 地 定义 计算 
机 可 以 使 用 的 不 同 指令 集 ， 使 编程 变 得 相对 简单 。 程 序 员 通 过 组 合 这 些 不 同 的 指令 来 创建 任 
意 数量 的 程序 。 每 个 程序 可 以 是 不 同 指令 的 不 同 组 合 。 

3. 算法 

要 求 程序 包含 一 系列 指令 使 编程 变 得 可 能 ， 但 也 带 来 了 另外 一 些 使 用 计算 机 方面 的 问 
题 。 程 序 员 不 仅 要 了 解 每 条 指令 所 完成 的 任务 ， 还 要 知道 怎样 将 这 些 指令 结合 起 来 完成 一 些 
特定 的 任务 。 对 于 一 些 不 同 的 问题 ， 程 序 员 首 先 应 该 以 循序 渐进 的 方式 来 解决 问题 ， 接 着 尺 
量 找到 合适 的 指令 (指令 序列 ) 来 解决 问题 。 这 种 按 步骤 解决 问题 的 方法 就 是 所 谓 的 算法 。 
算法 在 计算 机 科学 中 起 到 了 重要 的 作用 ， 我 们 将 在 第 8 章 讨论 。 

4. 语言 

在 计算 机 时 代 的 早期 ， 只 有 一 种 称 为 机 器 语言 的 计算 机 语言 。 程 序 员 依靠 写 指令 的 方 
式 (使 用 位 模式 ) 来 解决 问题 。 但 是 随 着 程序 越 来 越 大 ， 采 用 这 种 模式 来 编写 很 长 的 程序 变 
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得 单调 乏味 。 计 算 机 科学 家 研究 出 利用 符号 来 代表 位 模式 ， 就 像 人 们 在 日 常 中 用 符号 (单词 ) 
来 代替 一 些 常用 的 指令 一 样 。 当 然 ， 人 们 在 日 常生 活 中 所 用 的 一 些 符 号 与 计算 机 中 所 用 的 符 
号 不 同 。 这 样 计算 机 语言 的 概念 诞生 了 。 自 然 语言 (例如 英语 ) 是 丰富 的 语言 ， 并 有 许多 正 
确 组 合 单词 的 规则 ; 相对 而 言 ， 计 算 机 语言 只 有 比较 有 限 的 符号 和 单词 。 第 9 章 将 介绍 计算 
机 语言 。 

5. 软件 工程 

在 汉 : 诺 依 曼 模 型 中 没有 和 定义 软件 工程 ， 软 件 工程 是 指 结构 化 程序 的 设计 和 编写 。 今 
天 ， 它 不 仅仅 是 用 来 描述 完成 某 一 任务 的 应 用 程序 ， 还 包括 程序 设计 中 所 要 严格 遵循 的 原理 
和 规则 。 我 们 所 讨论 的 这 些 原 理 和 规则 综合 起 来 就 是 第 10 章 中 要 说 的 软件 工程 。 

6. 操作 系统 

在 计算 机 演变 过 程 中 ， 科 学 家 们 发 现 有 一 系列 指令 对 所 有 程序 来 说 是 公用 的 。 例 如 ， 告 
诉 计算 机 在 哪里 接收 和 发 送 数据 的 指令 在 几乎 所 有 的 程序 中 都 要 用 到 。 如 果 这 些 指令 只 编写 
一 次 就 可 以 用 于 所 有 程序 ， 那 么 效率 将 会 大 大 提高 。 这 样 ， 就 出 现 了 操作 系统 的 概念 。 计 算 
机 操作 系统 最 初 是 为 程序 访问 计算 机 部 件 提供 方便 的 一 种 管理 程序 。 今 天 ， 操 作 系 统 所 完成 
的 工作 远 不 止 这 些 ， 具 体 的 内 容 将 在 第 7 章 介 绍 。 


1.4 历史 
在 本 节 中 ， 我 们 简要 回顾 一 下 计算 和 计算 机 的 历史 。 我 们 将 其 分 为 三 个 阶段 。 


1.4.1 机械 计 算 机 器 ( 1930 年 以 前 ) 
在 这 个 阶段 ， 人 们 发 明了 一 些 用 来 进行 计算 的 机 器 ， 它 们 与 计算 机 的 现代 概念 几乎 没有 
相似 之 处 。 

。 在 17 世纪， 法 国 著名 的 数学 家 和 物理 学 家 布 菜 斯 . 帕斯卡 ( Blaise Pascal) 发 明了 
Pascaline， 这 是 一 个 用 来 进行 加 减 运算 的 计算 机 器 。 到 了 20 世纪 ， 尼 克 劳 斯 * 沃 思 
( Niklaus Wirth) 发 明了 一 种 结构 化 的 程序 设计 语言 ， 他 将 其 命名 为 Pascal 语言 ， 用 
来 纪念 这 位 发 明 首 台 机 械 计算 机 器 的 科学 家 。 

。 在 17 世纪 后 期 ,德国 数学 家 七 特 弗 里 德 . 莱 布 尼 芯 ( Gottfried Leibnitz) 发 明了 一 台 
既 能 够 做 乘除 运算 又 能 做 加 减 运 算 的 更 加 复杂 的 计算 机 器 。 这 人 台 机 器 被 称 为 莱 布 尼 艾 
之 轮 (Leibnitz's Wheel)。 

。 第 一 台 利 用 存储 和 编程 概念 的 机 器 是 雅 卡尔 提花 织 机 (Jacquard loom)， 它 是 由 约 瑟 
夫 -玛丽 : 雅 卡尔 ( Joseph-Marie Jacquard) 在 19 世纪 初期 发 明 的 。 这 种 织 机 利用 穿 
孔 卡 (类 似 于 存储 程序 ) 来 控制 织 布 过 程 中 经 线 的 提升 。 

。1823 年 ， 查 尔 斯 . 巴 比 奇 (Charles Babbage) 发 明了 一 种 差分 引擎 ， 它 不 仅 能 够 很 
容易 地 进行 数学 运算 ， 还 可 以 解 多 项 式 方程 。 后 来 ， 他 发 明了 一 种 叫 作 分 析 引 擎 的 
机 万 ， 在 某 种 程度 上 和 现代 计算 机 的 概念 类 似 。 该 机 器 由 4 个 部 分 组 成 : 制造 场 ( 现 
在 的 算术 逻辑 单元 )、 存 储 单元 (存储 器 )、 操 作者 (控制 单元 ) 和 输出 单元 (输入 / 
输出 )。 

。 1890 年 ， 在 美国 人 口 普查 办 公 室 工作 的 赫 尔 曼 ' 何 勒 里 斯 ( Herman Hollerith) 设计 
并 制造 出 具有 编程 能 力 的 机 器 ， 该 机 器 可 以 自动 阅读 、 计 数 和 排列 存储 在 穿孔 卡 上 的 


数据 。 





1.4.2 ”电子 计算 机 的 诞生 ( 1930 一 1950 年 ) 


1930 一 1950 年 ， 那 些 被 视 为 电子 计算 机 工业 先驱 的 科学 家 们 发 明了 一 些 计算 机 。 
1. 早期 的 电子 计算 机 
这 一 时 期 的 早期 计算 机 并 不 是 将 程序 存储 到 存储 器 中 ， 所 有 的 计算 机 都 是 在 外 部 进行 编 
程 的 。 有 以 下 5 种 比较 杰出 的 计算 机 : 
。 第 一 台 用 来 完成 特定 任务 的 计算 机 是 通过 将 信息 进行 电子 编码 来 实现 其 功能 的 ， 它 是 
由 约翰 阿 塔 纳 索 夫 ( John V. Atanasoff) 及 其 助手 克利 福 德 * 贝 里 ( Clifford Berry) 
于 1939 年 发 明 的 。 它 又 被 称 为 ABC ( Atanasoff Berry Computer)， 主 要 用 于 实现 解 


线性 方程 组 。 
。 在 同一 时 期 ， 名 为 康 拉 德 . 朱 斯 (Konrad Zuse) 的 德国 数学 家 设计 出 通用 计算 机 ， 并 


命名 为 “Z1”。 
。 20 世纪 30 和 年代， 美国 海军 和 IBM 公司 在 哈佛 大 学 发 起 了 一 项 工程 ， 在 霍华德 . 菊 
肯 (Howard Aiken) 的 直接 领导 下 建造 了 一 台 名 为 Mark I 的 巨型 计算 机 。 这 种 计算 
机 既 使 用 了 电子 部 件 ， 也 使 用 了 机 械 部 件 。 
。 在 英国 ， 阿 兰 . 图 灵 发 明了 一 台 名 为 巨人 (Colossus) 的 计算 机 ， 这 台 计 算 机 是 为 破 
译 德 国 Enigma 密码 而 设计 的 。 
。 第 一 台 通 用 的 、 完 全 电子 的 计算 机 由 约翰 ' 莫 奇 勒 (John Mauchly) 和 普 雷 斯 波 ' 埃 
克 特 (本 Presper Eckert) 发 明 ， 这 人 台 计 算 机 被 称 为 ENIAC (Electronic Numerical 
Integrator and Calculator， 电 子 数字 积分 器 和 计算 器 )。 它 是 在 1946 年 完成 设计 的 ， 
利用 了 将 近 18 000 个 真空 管 ， 有 100 英尺 6 长 ，10 英尺 高 ， 重 达 30 吨 。 
2. 基于 汉 ' 诺 依 曼 模型 的 计算 机 
前 面 5 种 计算 机 的 存储 器 仅仅 用 来 存放 数据 ， 它 们 利用 配 线 或 开关 进行 外 部 编程 。 
冯 “' 诺 依 曼 提 出 程序 和 数据 应 该 存储 在 存储 器 中 。 按 照 这 种 方法 ， 每 次 使 用 计算 机 来 完成 一 
项 新 的 任务 。 你 只 需要 改变 程序 ， 而 不 用 重新 布线 或 者 调节 成 百 上 千 的 开关 。 
第 一 台 基 于 冯 氏 思想 的 计算 机 于 1950 年 在 宾夕法尼亚 大 学 诞生 ， 命 名 为 EDVAC。 与 
此 同时 ， 英国 剑 桥 大 学 的 英里 斯 * 威 尔 克 斯 (Maurice Wilkes) 制造 了 同样 类 型 的 被 称 为 
EDSAC 的 计算 机 。 


1.4.3 ”计算 机 的 诞生 ( 1950 年 至 今 ) 


1950 年 以 后 出 现 的 计算 机 都 差不多 基于 冯 “' 诺 依 曼 模 型 。 它 们 变 得 更 快 、 更 小 、 更 便 
宜 , 但 原理 几乎 是 相同 的 。 历 史学 家 将 这 一 时 期 划分 为 几 代 ， 每 一 代 计 算 机 的 改进 主要 体现 
在 硬件 或 软件 方面 (而 不 是 模型 )。 


1. 第 一 代 计 算 机 
第 一 代 计 算 机 (大约 1950 一 1959 年 ) 以 商用 计算 机 的 出 现 为 主要 特征 。 在 这 个 时 期 ， 计 


算 机 只 有 专家 们 才能 使 用 。 它 们 被 锁 在 房子 里 ， 限 制 操作 者 和 计算 机 专家 以 外 的 人 员 进 入 。 
计算 机 体积 庞大 ， 且 使 用 真空 管 作为 电子 开关 。 此 时 的 计算 机 只 有 大 的 机 构 才能 负担 得 起 。 


2. 第 二 代 计 算 机 
第 二 代 计 算 机 (大约 1959 一 1965 年 ) 使 用 晶体 管 代 替 了 真空 管 。 这 既 减 小 了 计算 机 的 
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体积 ， 也 节省 了 开支 ， 从 而 使 得 中 小 型 企业 也 可 以 负担 得 起 。FORTRAN 和 COBOL (参见 
第 9 章 ) 这 两 种 高 级 计算 机 程序 设计 语言 的 发 明 使 得 编程 更 加 容易 。 这 两 种 语言 将 编程 任务 
和 计算 机 运算 任务 分 离开 来 。 例 如 ， 土 木工 程 师 能 够 直接 编写 一 个 FORTRAN 程序 来 解决 
问题 ， 而 不 必 涉 及 计算 机 结构 中 的 具体 电子 细节 。 


3. 第 三 代 计 算 机 
集成 电路 〈 晶 体 管 、 导 线 以 及 其 他 部 件 做 在 一 块 单 芯 片上 ) 的 发 明 更 加 减少 了 计算 机 的 


成 本 和 大 小 。 小 型 计算 机 出 现在 市 场 上 。 封 装 的 程序 ， 就 是 通常 所 说 的 软件 包 也 已 经 有 售 。 
小 型 公司 可 以 买 到 需要 的 软件 包 (如 会 计 程 序 )， 而 不 必 写 自己 的 程序 。 一 个 新 的 行业 
软件 行业 就 此 诞生 了 。 这 个 时 期 大 概 从 1965 年 持续 到 1975 年 。 


4. 第 四 代 计 算 机 
第 四 代 计 算 机 (大约 1975 一 1985 年 ) 出 现 了 微型 计算 机 。 第 一 个 桌面 计算 器 ( Altair 


8800 ) 出 现在 1975 年 。 电 子 工业 的 发 展 允 许 整个 计算 机 子 系统 做 在 单 块 电路 板 上 。 这 一 时 
代 还 出 现 了 计算 机 网 络 (参见 第 6 章 )。 


5. 第 五 代 计 算 机 
这 个 还 未 终止 的 时 代 始 于 1985 年 。 这 个 时 代 见 证 了 掌上 计算 机 和 台式 计算 机 的 诞生 、 


第 二 代 存 储 媒体 (CD-ROM、DYVD 等 ) 的 改进 、 多 媒体 的 应 用 以 及 虚拟 现实 现象 。 


1.5 计算 机 科学 作为 一 门 学 科 

随 着 计算 机 的 发 明 ， 带 来 了 新 的 学 科 : 计算 机 科学 。 如 同 其 他 任何 学 科 一 样 ， 计 算 机 科 
学 现在 被 划分 成 几 个 领域 。 我 们 可 以 把 这 些 领 域 归纳 为 两 大 类 : 系统 领域 和 应 用 领域 。 系 统 
领域 涵盖 那些 与 硬件 和 软件 构成 直接 有 关 的 领域 ， 例 如 计算 机 体系 结构 、 计 算 机 网 络 、 安 全 
问题 、 操 作 系 统 、 算 法 、 程 序 设计 语言 以 及 软件 工程 。 应 用 领域 涵盖 了 与 计算 机 使 用 有 关 的 
领域 ， 例 如 数据 库 和 人 工 智 能 。 本 书 对 所 有 这 些 领域 采用 广度 优先 的 方式 介绍 。 学 完 本 书 之 
后 ， 读 者 应 该 有 足够 的 信息 来 选择 专业 方向 。 


1.6 ”课程 纲要 
在 本 章 之 后 ， 本 书 分 为 六 大 部 分 。 


1.6.1 第 一 部 分 : 数据 的 表示 与 运算 
该 部 分 包括 第 2、3 和 4 章 。 第 2 章 讨论 数字 系统 一 一 数量 如 何 使 用 符号 来 表示 。 第 3 
章 讨论 不 同 的 数据 如 何 存 储 在 计算 机 中 。 第 4 章 讨论 一 些 基 本 的 位 运算 。 


1.6.2 第 二 部 分 : 计算 机 硬件 


这 部 分 包括 第 5、6 章 。 第 5 章 给 出 计算 机 硬件 的 通用 概念 ， 讨 论 不 同 的 计算 机 组 成 。 
第 6 章 阐明 不 同 的 单个 计算 机 是 如 何 连接 成 计算 机 网 络 以 及 互联 网 的 。 本 章 还 特别 涉及 了 与 
互联 网 及 其 应 用 有 关 的 话题 。 


1.6.3 第 三 部 分 : 计算 机 软件 


这 部 分 包括 第 7、8、9 和 10 章 。 第 7 章 讨论 操作 系统 一 一 一 种 用 户 (人 或 者 应 用 程序 ) 
用 来 控制 硬件 访问 的 系统 软件 。 第 8 章 说 明 问 题 求 解 如 何 归 约 成 为 该 问题 编写 算法 。 第 9 章 





本 .二 





是 当今 程序 设计 语言 之 旅 。 最 后 ， 第 10 章 是 软件 工程 的 概述 ， 这 是 软件 开发 的 工程 方法 。 


1.6.4 第 四 部 分 : 数据 组 织 与 抽象 


这 部 分 是 对 第 一 部 分 的 补充 。 在 计算 机 科学 中 ， 原 子 数据 汇集 成 记录 、 文 件 和 数据 库 。 
数据 抽象 使 得 程序 员 能 创建 关于 数据 的 抽象 观念 。 第 四 部 分 包括 第 11、12、13 和 14 章 。 第 
11 章 讨论 数据 结构 ， 即 集合 相同 或 不 同类 型 的 数据 到 一 个 类 属 中 。 第 12 章 讨论 抽象 数据 类 
型 。 第 13 章 说 明 不 同文 件 结构 是 如 何 用 于 不 同 的 目的 的 。 最 后 ， 第 14 章 讨 论 数据 库 。 


1.6.5 ”第 五 部 分 : 高 级 话题 


第 五 部 分 给 出 高 级 话题 的 概述 ， 这 些 话题 是 计算 机 科学 专业 学 生 在 今后 的 教育 中 会 遇 到 
的 。 这 部 分 包括 第 15、16、17 和 18 章 。 第 15 章 讨 论 数据 压缩 ， 这 在 今天 的 数据 通信 中 很 
普遍 。 第 16 章 探 索 与 安全 有 关 的 问题 ， 当 我 们 通过 不 安全 的 信道 通信 时 ， 安 全 问题 变 得 越 
来 越 重要 。 第 17 章 讨 论 计 算 理 论 ， 即 哪些 是 可 计算 的 ， 哪 些 是 不 可 计算 的 。 最 后 ,第 18 章 
给 出 一 些 人 工 智能 的 观点 ， 在 计算 机 科学 中 ， 这 是 一 个 日 益 受 到 挑战 的 话题 。 


1.6.6 ”第 六 部 分 : 社交 媒体 和 社会 话题 
第 六 部 分 简要 介绍 社交 媒体 和 社会 话题 ， 这 可 能 是 学 计算 机 科学 的 学 生 有 兴趣 去 探索 的 
两 个 话题 。 
1.7 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


® Schneider, G. M. and Gersting, J. L. Invitation to Computer Science, Boston, MA: 


Course Technology, 2004 
e。 Dale, N. and Lewis, J. Computer Science Tlluminated, Sudbury, MA: Jones and Bartlett, 


2004 
。 Patt, Y, and Patel, S. Introduction to Computing Systems, New York: McGraw-Hill, 2004 


天 键 术语 

algorithm (算法 ) memory (存储 器 ) 

arithmetic logic unit (ALU， 算 术 逻 辑 单元 ) microcomputer ( 微 处 理 器 ) 
computer languages (计算 机 语言 ) operating system (操作 系统 ) 
control unit (控制 单 元 ) output data (输出 数据 ) 

data processor (数据 处 理 器 ) program (程序 ) 

input data (输入 数据 ) structured programs (结构 化 程序 ) 
input/output subsystem (输入 /输出 子 系统 ) software engineering (软件 工程 ) 
instruction (指令 ) Turing machine (图 灵机 ) 
integrated circuit (集成 电路 ) Turing model (图 灵 模 型 ) 


logical operation〈 逻 辑 运算 ) von Neumann model ( 冯 “' 诸 依 曼 模 型 ) 
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小 结 z 

。 阿兰 . 图 灵 在 1936 年 首次 提出 了 一 个 通用 的 计算 设备 的 设想 。 他 设想 所 有 的 计算 都 
可 能 在 一 种 特殊 的 机 器 上 执行 ， 这 就 是 现在 所 说 的 图 灵机 。 

。 基 于 冯 ， 诺 依 曼 模型 建造 的 计算 机 分 为 4 个 子 系统 ; 存储 器 、 算 术 逻 辑 单元 、 控 制 单 
元 和 输入 /输出 。 汉 “' 诺 依 曼 模 型 指出 ， 程 序 必 须 存 储 在 存储 器 中 。 

。 我 们 可 以 认为 计算 机 由 三 大 部 分 组 成 : 计算 机 硬件 、 数 据 和 计算 机 软件 。 

。 计算 和 计算 机 的 历史 可 分 为 三 个 阶段 : 机 械 计算 机 器 阶段 (1930 年 以 前 )， 电 子 计算 
机 阶段 ( 1930 一 1950 年 )， 以 及 包括 5 代 现 代 计 算 机 的 阶段 。 

。 随 着 计算 机 的 发 明 ， 带 来 了 新 的 学 科 : 计算 机 科学 。 如 同 任 何其 他 学 科 一 样 ， 计 算 机 
科学 现在 被 划分 成 几 个 领域 。 


1.8 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相 关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相 
关 测 验 题 以 检测 对 本 章 内 容 的 理解 。 


复 习题 


Q1-1 定义 一 个 基于 图 灵 模 型 的 计算 机 。 

Q1-2 ”定义 一 个 基于 冯 ， 诺 依 曼 模 型 的 计算 机 。 

Q1-3 ”在 基于 图 灵 模 型 的 计算 机 中 ， 程 序 的 作用 是 什么 ? 
Q1-4 在 基于 冯 : 诺 依 坚 模 型 的 计算 机 中 ， 程 序 的 作用 是 什么 ? 
Q1-5 ”计算 机 中 有 哪些 子 系统 ? 

Q1-6 计算 机 中 存储 器 子 系统 的 功能 是 什么 ? 

Q1-7 计算 机 中 ALU 子 系统 的 功能 是 什么 ? 

Q1-8 计算 机 中 控制 单元 子 系统 的 功能 是 什么 ? 

Q1-9 计算 机 中 输入 /输出 子 系统 的 功能 是 什么 ? 

Q1-10 简 述 5 代 计 算 机 。 


练习 题 

P1-1 解释 为 什么 计算 机 不 能 解决 那些 计算 机 外 部 世界 无 解决 方法 的 问题 。 

P1-2 如 果 一 台 小 的 便宜 的 计算 机 可 以 做 大 型 昂贵 的 计算 机 能 做 的 同样 事情 ， 为 什么 人 们 需要 大 
的 呢 ? 

P1-3 ”研究 Pascaline 计算 器 ， 看 看 它 是 否 符合 图 灵 模 型 。 

P1-4 研究 莱 布 尼 蒋 之 轮 ， 看 看 它 是 否 符合 图 灵 模 型 。 

P1-5 研究 雅 卡尔 提花 织 机 ， 看 看 它 是 否 符合 图 灵 模 型 。 

P1-6 研究 查尔斯 巴 比 奇 分 析 引 擎 ， 看 看 它 是 否 符合 汉 ， 诺 依 曼 模型 。 

P1-7 研究 ABC 计算 机 ， 看 看 它 是 否 符 合 汉 … 诺 依 曼 模 型 。 

P1-8 ”研究 并 找 出 键盘 起 源 于 哪 一 代 计 算 机 。 


| 第 2 章 


Foundations of Computer Science, Fourth Edition 


数字 系统 


本 章 是 第 3、4 章 的 先导 。 在 第 3 章 中 我 们 将 说 明 数 据 是 如 何 存储 在 计算 机 中 的 。 在 第 
4 章 中 ， 我 们 讲解 逻辑 和 算术 运算 是 如 何 作用 于 数据 的 。 本 章 为 理解 第 3、4 章 的 内 容 做 准 
备 。 了 解数 字 系 统 的 读者 可 以 跳 过 本 章 转 到 第 3 章 ， 并 不 影响 连贯 性 。 注 意 本 章 所 讨论 的 数 
字 系 统 是 “ 纸 和 笔 的 代表 物 ”: 第 3 章 讲解 这 些 数字 如 何 存 储 在 计算 机 中 。 

目标 

.通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 理解 数字 系统 的 概念 ; 

。 分 清 非 位 置 化 和 位 置 化 数字 系统 ; 

。 描述 十 进 制 系统 (以 10 为 底 ); 

。 描述 二 进 制 系统 (以 2 为 底 ); 

。 描述 十 六 进 制 系统 (以 16 为 底 ); 

。 描述 八进制 系统 (以 8 为 底 ); 

。 将 二 进 制 、 八 进 制 或 十 六 进 制 数字 转换 为 十 进 制 系统 ; 

。 将 十 进 制 数字 转换 为 二 进 制 、 八 进 制 或 十 六 进 制 系 统 ; 

。 将 二 进 制 和 八进制 数字 相互 转换 ; 

。 将 二 进 制 和 十 六 进 制 数字 相互 转换 ; 

。 查找 在 各 种 系统 中 代表 特定 数值 所 需 的 数码 。 


2.1 引言 

数字 系统 (或 数码 系统 ) 定义 了 如 何 用 独特 的 符号 来 表示 一 个 数字 。 在 不 同 的 系统 中 ， 
一 个 数字 有 不 同 的 表示 方法 。 例 如 ， 两 个 数字 (2A)is 和 (52)s 都 是 指 同样 的 数量 (42)io， 但 
是 它们 的 表示 截然 不 同 。 这 就 如 同 使 用 法 语 单词 cheval 和 拉丁 语 单词 equus 来 指称 同一 个 实 
体 “ 马 ”一 样 。 

正如 我 们 在 语言 中 使 用 符号 (字符 ) 来 创建 单词 一 样 ， 我 们 使 用 符号 (数码 ) 来 表示 数 
字 。 但 是 ， 我 们 知道 任何 语言 中 的 符号 (字符 ) 数量 都 是 有 限 的 。 我 们 需要 重复 并 组 合 它们 
来 创建 单词 。 数 字 也 是 一 样 : 我 们 使 用 有 限 的 数字 符号 (数码 ) 来 表示 数字 ， 这 意味 着 数码 


需要 重复 使 用 。 
一 些 数字 系统 已 经 在 过 去 广 为 使 用 ， 并 可 以 分 为 两 类 : 位 置 化 系统 和 非 位 置 化 系统 。 我 


们 的 主要 目标 是 讨论 位 置 化 数字 系统 ， 但 也 给 出 非 位 置 化 系统 的 例子 。 


2.2 位置 化 数字 系统 
在 位 置 化 数字 系统 中 ,数字 中 符号 所 占据 的 位 置 决 定 了 其 表示 的 值 。 在 该 系统 中 ， 数 字 
这 样 表示 : 


12 常 2 莫 


士 (SxK-1…S25150. S102°**S1) 
它 的 值 是 : Mm de > et 二 Ve 
n=+ xi x bb +tS1 Xx bitSox b+ Sxb "+S xb ttS .xb 
其 中 ，5 是 一 套 符号 集 ; b 是 底 (或 基数 )， 它 等 于 5 符号 集中 的 符号 总 数 ， 其 中 Sk 和 S51 分 
别 是 代表 整数 和 小 数 部 分 的 符号 。 注 意 我 们 使 用 的 表达 式 可 以 从 右边 或 左边 扩展 。 也 就 是 
说 ，2 的 血 可 以 从 一 个 方向 由 0 到 天 -1， 还 可 以 从 男 一 个 方向 由 -1 到 -LK。b。 的 非 负 数 短 与 
该 数字 的 整数 部 分 有 关 ， 而 负数 寡 与 该 数字 的 小 数 部 分 有 关 。 土 符号 表示 该 数字 可 正 可 负 。 
本 章 我 们 将 学 习 一 些 位 置 化 数字 系统 。 


2.2.1 十 进 制 系统 

本 章 首 先 讨论 的 位 置 化 数字 系统 是 十 进 制 系统 。decimal (十 进 制 ) 来 源 于 拉丁 词根 
decem (十 )。 在 该 系统 中 ， 底 b= 10 并 且 我 们 用 10 个 符号 来 表示 一 个 数 。 符 号 集 是 $={0,1， 
本 本 古 二 是 汪汪 Ee one bento 
本 章 中 ， 我 们 使 用 土 符号 表示 一 人 
计算 机 用 以 处 理 该 符号 的 方式 不 同 ， fa 3 bib 


“计算 机 存储 正信 数 的 方式 不 同 。 
在 十 进 制 系统 中 ， 数 字 写 为， 
士 (CSkx-1…32S190. 3_1S_2…S_r)io 
但 是 为 了 简便 ， 我 们 通常 省 略 圆 括号 、 底 和 正 号 (对 于 正 数 )。 例 如 ,我 们 把 (552.23)， 写 


成 552.23， 底 和 加 号 是 隐 含 的 。 


1. 整数 
在 十 进 制 系统 中 ， 整 数 (没有 小 数 部 分 的 整 型 数字 ) 是 我 们 所 热 悉 的 ， 在 朋党 引 于 引 





KE 


其 中 ， 5 是 1 个 数码 ， 呈 =10 是 订 是 洒 袜 的 教 量 。 
另 一 种 在 数字 系统 中 显示 一 个 整数 的 方法 是 使 用 位 置 量 ， 即 用 10 的 短 (10"，10'， 
10“ ) 表示 十 进 制 数字 。 图 2-1 显示 了 在 十 进 制 系统 中 使 用 位 置 量 表 示 一 个 整数 。 


10x 10? se 10? 10! 10? ”位 置 量 





N= 士 Seix 10 + xl0c2 + e000 + Sx10 + Sxl0 十 xl0 值 
图 2-1 在 十 进 制 系统 中 使 用 位 置 量 表示 整数 


全 ”以 下 显示 了 在 十 进 制 系统 中 使 用 位 置 量 表示 整数 +224。 
Wm 且 位 和 
数字 

N=+ 2X107 + 2 10! + 4X105 值 


和 玫 他 系统 13 


注意 ， 在 位 置 1 的 数码 2 值 为 20, 但 是 在 位 置 2 的 同一 个 数码 其 值 为 200。 还 要 注意 通 
常 我 们 省 略 掉 的 加 号 ， 实 际 上 是 隐 含 的 。 

以 下 显示 了 在 十 进 制 系统 中 使 用 位 置 量 表示 整数 -7508。 我 们 已 经 使 用 1， 
10，100 和 1000 来 代替 10 的 寡 。 


T000 1000228 0 位置 量 
7 0 4 i 数字 
N=- (7X1000; + $5x100 + 0Xx10 + ;8x1) 写 值 


最 大 值 

有 时 我 们 需要 知道 可 以 用 数码 天 表示 的 十 进 制 整数 的 最 大 值 。 答 案 是 Ns = 10 -1。 例 
如 ， 如 果 玉 = 5， 那 么 这 个 最 大 值 就 是 Nsx = 10 -1 = 99 999。 

2. 实数 

在 十 进 制 系统 中 ， 实 数 ( 带 有 小 数 部 分 的 数字 ) 也 是 我 们 所 熟悉 的 。 例 如 ， 使 用 该 系统 
来 表示 元 和 分 ($23.40 ) 整数 。 我 们 可 以 把 实数 表示 为 士 Sk 必 SiSo S.1…S_:， 其 值 计 算 为 : 

整数 部 分 小 数 部 分 “ 
R=+ Skix10 H+: x10 FS0x10% + WS3x10 FHS X10 

其 中 ，5 是 1 个 数码 ，b = 10 是 底 , 天 是 整数 部 分 数码 的 数量 , 工 是 小 数 部 分 数码 的 数量 。 
十 进 制 小 数 点 是 我 们 用 于 分 割 整数 部 分 和 小 数 部 分 的 。 


以 下 显示 了 实数 +24.13 的 位 置 量 。 
101 10° 107) 107 位 置 量 


2 4 * 1 3 数字 
R=+ 2x10 + 4x1l| + 1x0.1 + 3x0.01 值 


2.2.2 二进制 系统 


我 们 在 本 章 中 讨论 的 第 二 种 位 置 化 数字 系统 是 二 进 制 系统 。binary (二 进 制 ) 来 源 于 拉 
丁 词根 bini (二 )。 在 该 系统 中 ， 底 b= 2 并 且 用 两 个 符号 来 表示 一 个 数 ， 即 5S = {0, 1}。 该 
系统 中 的 符号 常 被 称 为 二 进 制 数 码 或 位 (位 数码 )。 如 我 们 将 要 在 第 3 章 看 到 的 ， 数 据 和 程 
序 是 以 二 进 制 模式 (即位 串 ) 存储 于 计算 机 中 的 。 这 是 因为 计算 机 由 电子 开关 制 成 ， 它 们 仅 
有 开 和 关 两 种 状态 。 位 1 表示 这 两 种 状态 之 一 ， 位 0 表示 男 一 种 状态 。 

1. 理 数 

可 以 把 整数 表示 为 + (Sk-1'**S1S0)2, 其 值 计算 为 : 

N= FSR 1X2 TF SaX It Sx 2 和 8 X21HS0X 2 

其 中 ，5; 是 1 个 数码 ，b = 2 是 底 , KK 是 数码 的 数量 。 另 一 种 表示 二 进 制 数 的 方法 是 使 用 位 
置 量 (2" 2',…, 2*!)。 图 2-2 显示 了 在 二 进 制 系统 中 使 用 位 置 量 表示 一 个 数 。 





N=i8 X21 + BO + es 05X21 二 Sx2 值 
图 2-2 在 二 进 制 系统 中 使 用 位 置 量 表示 整数 


莲 2 划 





以 下 显示 了 与 十 进 制 数 25 等 值 的 二 进 制 数 (11001):。 下 标 2 表示 底 是 2。 
A 2 ”位 置 量 
数字 
N= + JX20+ TX2 N+ 20X22 + ‘0x2M+ SEX29% 值 
注意 ， 等 值 的 十 进 制 数 为 N=16+8+0+0+1=25。 
最 大 值 
数码 天 表示 的 二 进 制 整数 的 最 大 值 是 Ns = 2 所 。 例 如 ， 如 果 天 = 5， 那 么 这 个 最 大 值 
就 是 Now = 25 一 1= 31。 


2. 实数 
在 二 进 制 系统 中 ， 一 个 实数 (可 带 有 小 数 部 分 的 数字 ) 可 以 由 左边 的 天 位 和 右边 的 工 位 


组 成 ， 即 +(Sk-1'**S1S0. S-1°**S-7), 其 值 计算 为 : 
整数 部 分 小 数 部 分 
R =+ 3 又 2 人 二 全 于 5 NEGRI + SX EX. 
其 中 ，5; 是 1 个 位 ，b=2 是 底 , 玉 是 小 数 点 左边 位 的 数量 ， L 是 小 数 点 右边 位 的 数量 。 注 意 
KK 从 0 开始 ， 而 L 从 -1 开始 。 最 高 的 寡 是 天 -1 且 最 低 的 笑 是 -L。 
以 下 显示 了 和 5.75 等 值 的 二 进 制 数 (101. bs 








位 置 量 
i 和 数字 
R= ) 守 闻 六 十 EN , T1920 + jxX9 + 1X27 值 


注意 ， 等 值 的 十 进 制 数 为 R=4+0+1+0.5+0.25 = 5.75。 


2.2.3 十 六 进 制 系统 


尽管 二 进 制 系统 用 于 存储 计算 机 数据 ， 但 是 它 并 不 便于 在 计算 机 外 部 表示 数字 ， 因 为 与 
十 进 制 符号 相 比 ， 二 进 制 符号 过 长 。 然 而 ， 十 进 制 不 像 二 进 制 那样 直接 显示 存储 在 计算 机 中 
的 是 什么 。 在 二 进 制 位 数 和 十 进 制 数码 的 数量 之 间 没 有 显然 的 关系 。 正 如 我 们 看 到 的 那样 ， 
它们 之 间 的 转换 也 不 快捷 。 

为 了 克服 这 个 问题 ， 发 明了 两 种 位 置 化 系统 : 十 六 进 制 和 八进制 。 我 们 先 讨论 更 常用 的 
十 六 进 制 系统 。hexadecimal (十 六 进 制 ) 源 于 希腊 词根 hex (六) 和 拉丁 词根 decem (十 )。 
为 了 与 十 进 制 和 二 进 制 一 致 ， 它 应 该 称 作 sexadecimal， 源 于 拉丁 词根 sx 和 decem。 在 该 系 
统 中 ， 底 b=16 并 且 用 16 个 符号 来 表示 一 个 数 。 字 符 集 是 S={0，1，2，3，4，5，6，7，8， 
9，A，B，C，D，E，F}。 注 意 符号 A，B，C,，D，B，F (大 写 或 小 写 ) 分 别 等 于 10，11， 
12，13，14 和 15。 该 系统 中 的 符号 常 被 称 为 十 六 进 制 数码 。 

1. 整数 

TR Ce ed i 和 
其 中 ， 8 是 1 个 数码 ， D6 天 是 数码 的 数量 。 

另 一 种 表示 十 六 进 制 数 的 方法 是 使 用 位 置 量 (16"，16!，…，16“0)。 图 2-3 显示 了 在 

六 进 制 系统 中 使 用 位 置 量 表示 一 个 数 。 
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16" 16"? eo 16: 16: 16? ”位 置 量 
| | | | | 


N= 士 Six1654 + Sax1642 十 。。。 十 Sxl6: + Sxl6! 二 5x16? 值 
图 2-3 在 十 六 进 制 系统 中 使 用 位 置 量 表示 整数 


以 下 显示 了 与 十 进 制 数 5 TT (2AE)ie。 





六 ET 位 置 量 
2 人 于 数字 
N= 2x16: + 10X16! + 14x16° 值 
注意 ,在 十 进 制 系 统 中 该 数 为 N= 512 + 160 + 14 = 686。 


最 大 值 

数码 天 表示 的 十 六 进 制 整数 的 最 大 值 是 Na = 16“ - 1。 例 如 ， 如 果 天 = 5， 那 么 这 个 最 
大 值 就 是 Nmw = 165-1=1048 575。 

2. 实数 

尽管 一 个 实数 可 以 用 十 六 进 制 系统 表示 ， 但 并 不 常见 。 


2.2.4 八进制 系统 


人 们 发 明 的 与 二 进 制 系统 等 价 并 用 于 计算 机 外 部 的 第 二 种 系统 是 八进制 系统 。octal ( 八 
进 制 ) 来 源 于 拉丁 词根 octo ( 八 )。 在 该 系统 中 ,， 底 = 8 并 且 用 8 个 符号 来 表示 一 个 数 。 字 
符 集 是 8 = {0, 1, 2, 3, 4, 5, 6, 7}。 该 系统 中 的 符号 常 被 称 为 八进制 数码 。 

1. 整数 

可 以 把 整数 表示 为 土 Sk-1'**S150， 其 值 计算 为 : 

N= ERX tS X86 x BF x 814SoX 8e 
其 中 ，5, 是 1 个 数码 ，b = 8 是 底 ，K 是 数码 的 数量 。 

另 一 种 表示 八进制 数 的 方法 是 使 用 位 置 量 (8*"，8!，…，8*"!)。 图 2-4 显示 了 在 八进制 系 

统 中 使 用 位 置 量 表示 一 个 数 。 





: i ei 和 


N= 二 5 X81 + Sixsgc + ss + Sx8 + 5x8! + 5x8 值 
图 2-4 在 八进制 系统 中 使 用 位 置 量 表示 整数 


以 下 显示 了 与 十 进 制 数 686 等 值 的 八进制 数 (1256)s。 
呈 。 恕 涡 位 置 量 





N= \ 6x8: 
注意 ， 等 信 的 十 进 制 数 为 = 512+128+40+6= 686。 


最 大 值 
数码 表示 的 八进制 整数 的 最 大 值 是 Nmwx = 8 - 1。 例 如 ， 如 果 开 = 5， 那 么 这 个 最 大 
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值 就 是 Nm = 8:-1 = 32 767。 


2. 实数 
尽管 一 个 实数 可 以 用 八进制 系统 表示 ， 但 并 不 常见 。 


2.2.5 4 种 位 置 化 数字 系统 小 结 
表 2-1 是 本 章 讨 论 的 4 种 位 置 化 数字 系统 的 小 结 。 
表 2-1 4 种 位 置 化 数字 系统 小 结 
elf | wz 


(156.23)s 
(A2C.A1)'e 





表 2-2 显示 了 数字 15 在 十 进 制 中 使 用 2 表 2-2 4 种 位 置 化 数字 系统 中 的 数字 比较 
个 数码 ， 在 二 进 制 中 使 用 4 个 数码 ， 在 八进制 “一 下 刘 和 十 六 进 制 
中 使 用 2 个 数码 ， 在 十 六 进 制 中 仅仅 使 用 1 个 ” 0 
EE WN EE Di 


数码 。 十 六 进 制 表示 法 显然 是 最 短 的 。 
wa | 3 | 2 
和 | | 

我 们 需要 知道 如 何 将 一 个 系统 中 的 数 
字 转 换 到 另 一 个 系统 中 等 价 的 数字 。 鉴 于 
我 们 更 熟悉 十 进 制 系 统 ， 先 讲解 如 何 从 其 
他 进 制 转换 到 十 进 制 。 接 着 讲解 如 何 从 十 进 
制 转换 到 其 他 进 制 。 最 后 讲解 如 何 简 便 地 进 


\ ol 上 mw | 


How>Io|lwl lalula|lwlb|-|o 


行 二 进 制 与 八进制 或 十 六 进 制 之 间 的 相互 10 | io0 | 1 | 
转换 。 1 | won | DB | 


1. 其 他 进 制 到 十 进 制 的 转换 2 | lo | 14 


这 种 转换 是 简单 而 迅速 的 。 我 们 将 数码 乘 _ 3 | lo | 5 
以 其 在 源 系统 中 的 位 置 量 并 求 和 便 得 到 在 十 进 一 
制 中 的 数 。 思 路 显示 在 图 2.5 中 。 


十 进 制 小 数 点 


下 1 国 国 " 国 = 
Es i 如 bp We 8 b+ 位 置 量 


Se x Plt ooo tSxX b+ Sxb + SIxp+Sixi +。。+Sixbph 乘法 
整数 部 分 小 数 部 分 十 进 制 
图 2-5 其 他 进 制 到 十 进 制 的 转换 
下 面 显示 如 何 将 二 进 制 数 (110.11); 转换 为 十 进 制 数 6.75。 


二 进 制 1 I 国 2 。 要 

位 置 量 2 9 2 

各 部 分 结果 页 + + S01+ 05 + ;1025 

十 进 制 : 6.75 

中 有 用 下面 显示 如 何 将 十 六 进 制 数 (1A. 23)i 转换 为 十 进 制 数 。 

十 六 进 制 ”多吉 。 区 六 ， 测 甸 3 3 

位 置 量 16: :16 6 1 

各 部 分 结果 16 + ;10 + 0.125 + 0.012 

十 进 制 : 26.137 

注意 ， 这 个 十 进 制 表示 并 不 精确 ， 因 为 3X16?2 = 0.011 718 75。 四 售 五 人 成 3 位 小 数 
(0.012)， 也 就 是 说 ，3X16-?=:0.012， 即 (1A.23)ie= 26.137。 数 字 转 换 时 我 们 需要 指明 允许 


保留 几 位 小 数 。 





下 面 显示 如 何 将 八进制 数 yr 17) 转换 为 十 进 制 数 。 
人 进 制 。 2 .0 





位 置 量 8 ele C9 
各 部 分 结果 16 + 成 二 WGN + 0.109 
十 进 制 ， 19.234 


在 十 进 制 中 (23.17)s 全 19.234。 再 一 次 ， 我 们 把 7X 8 = 0.109 375 四 舍 五 人 。 

2. 十进制 到 其 他 进 制 的 转换 

我 们 能 够 将 十 进 制 数 转换 到 与 其 等 值 的 其 他 进 制 。 需 要 两 个 过 程 ， 一 个 用 于 整数 部 分 ， 
另 一 个 用 于 小 数 部 分 。 

转换 整数 部 分 

整数 部 分 的 转换 可 使 用 连 除 。 图 2-6 显示 了 该 过 程 的 UML 图。 我 们 在 整 本 书 中 使 用 


UML 图 ， 对 于 不 熟悉 UML 图 的 读者 可 以 阅读 附录 B。 






源 ; 十进制 数 的 整数 部 分 
目标 : 十 进 制 数 转换 后 的 整数 部 分 
底 : 目标 底 


条 件 ; 商 为 0 


图 2-6 转换 整数 部 分 的 算法 
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我 们 称 十 进 制 数 的 整数 部 分 为 源 ， 转 换 后 的 整数 部 分 为 目标 。 我 们 先 创建 一 个 空 目标。 
接着 反复 除 以 源 并 得 到 商 和 余数 。 余 数 插入 目 BI 








标的 左边 ， 商 变 为 新 的 源 。 图 2-7 显示 了 在 每 
次 重复 中 如 何 得 到 商 。 图 oj 一 … 下 
下 面 我 们 使 用 一 些 例子 手工 演示 如 图 2-7 “ 
所 示 的 过 程 。 D [Dp 让 ao WY D:D; >D,| D: 目标 数码 
我 们 使 用 图 2-6 来 通过 一 些 案例 描述 手动 图 2-7 整数 部 分 转换 


过 程 。 
下 面 演示 如 何 将 十 进 制 数 35 转换 为 二 进 制 数 。 我 们 从 这 个 十 进 制 数 开始 ， 
一 边 连 续 寻 找 除 以 2 得 到 的 商 和 余数 ， 一 边 左 移 。 结 果 是 35 = (100011):。 
(BD i A 十 进 制 
LE 是 | | | | 
1 :1 3 下 二 进 制 
下 面 演示 如 何 将 十 进 制 数 126 转换 为 八进制 数 。 我 们 一 边 连续 寻找 除 以 8 
得 到 的 商 和 余数 ， 一 边 左 移 。 结 果 是 126 = (176)s。 
0 SE 一 十 进 制 
| | | 
八进制 
下 面 演示 如 何 将 十 进 制 数 126 转换 为 十 六 进 制 数 。 我 们 一 边 连续 寻找 除 以 
16 得 到 的 商 和 余数 ， 一 边 左 移 。 结 果 是 126=(7E)i6。 
一 区 和 人 一 十 进 制 
| | 
六 9 央 + 一 革 BE 十 六 进 制 





转换 小 数 部 分 
小 数 部 分 的 转换 可 使 用 连 乘法 。 我 们 称 十 进 制 数 的 小 数 部 分 为 源 ， 转 换 后 的 小 数 部 分 的 
数 为 目标 。 我 们 先 创建 一 个 空 目标 。 接 着 反复 乘 以 源 并 得 到 结果 。 结 果 的 整数 部 分 插入 目标 
的 右边 ， 而 小 数 部 分 成 为 新 的 源 。 图 2-8 显示 了 该 过 程 的 UML 图 。 图 2-9 显示 了 在 每 次 重 
复 中 如 何 得 到 目标 。 我 们 使 用 一 些 例子 手工 演示 如 图 2-9 所 示 的 过 程 。 
将 十 进 制 数 0.625 转换 为 二 进 制 数 。 
解 ”因为 0.625 没有 整数 部 分 ， 所 以 该 例子 显示 小 数 部 分 如 何 计算 。 这 里 是 以 2 为 底 。 
在 左边 写 上 这 个 十 进 制 数 。 连 续 乘 2， 并 记录 结果 的 整数 和 小 数 部 分 。 小 数 部 分 移 到 右边 ， 
整数 部 分 写 在 每 次 运算 的 下 面 。 当 小 数 部 分 为 0 或 达到 足够 的 位 数 时 结束 。 结 果 是 0.625 = 
(0.101):。 
十进制 - 2 — WO — 
! ! ! 
二 进 制 。 党 BE 。 守 00x 
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ps Ps CS | 
-通关 Ne 天 ” 


te oe j a 人 

= | we 
ry rv 
Ke Far De” | 


建立 一 个 空 目标 


开始 








源 : 十 进 制 数 的 小 数 部 分 
目标 : 转换 后 的 小 数 部 分 
条 件 : 小 数 部 分 为 0 或 者 目标 位 数 足 够 






将 结果 的 整数 部 分 
插入 目标 的 右边 


注意 : 小 数 永 远 不 为 零 ， 
当 创建 了 足够 的 位 数 后 停止 。 
图 2-9 转换 十 进 制 的 小 数 部 分 到 其 他 进 制 


下 面 演示 如 何 将 0.634 转换 为 八进制 数 且 精确 到 4 位 小 数 。 结 果 是 0.634 = 
(0.5044)s。 注 意 ， 以 8 为 底 时 乘 以 8 (八进制 )。 


十 进 抽 


Al 且 wb i Re 


下 面 演示 如 何 将 十 进 制 数 178.6 转换 为 十 六 进 制 数 且 精确 到 1 位 小 数 。 结 果 
是 178.6 = (B2.9)ie。 注 意 ， 以 16 为 底 时 除 或 乘 以 16 (基于 十 六 进 制 )。 


十 进 制 ” 吧 涡 一 天 史 下 0.6 一 涝 二 











| | | 
十 六 进 制 2 


\ 把 小 的 十 进 制 数 (通常 小 于 256 ) 转换 为 二 进 制 数 有 一 个 变通 的 方法 ， 即 把 
一 这 症 生 生生 下 
位 置 量 人 有 pe Fe 
十 进 制 对 等 量 128 64 32 16 8 4 
使 用 该 表 可 以 转换 165 为 二 进 制 数 (10100101):， 如 下 所 示 : 
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十 进 制 165=128 + ,0%+ 交 D+ 0 +0 + 4+0°+ 1 


二 进 制 ] 0 I 0 0 1 0 | 
当 分 母 是 2 的 吞 次 时 ， 用 类 似 的 方法 可 以 把 十 进 制 小 数 转换 为 二 进 制 。 
位 置 量 yy i 


十 进 制 对 等 量 /2 4 1/s ie 32 64 /2s 
使 用 该 表 可 以 转换 ”6 为 二 进 制 数 (0.011011)2， 如 下 所 示 : 
十 进 制 ”21 = 0 + + + + 3 
e+. Ns + Wz + /oa 
根据 十 进 制 对 等 的 值 排 列 这 些 分 数 。 注 意 ， 由 于 2 和 xs 缺失 ， 我 们 用 0 代替 。 
十 进 制 “= 四 + e+ + 天 + MM + i 
二 进 制 0 ] ] 0 1 ] 

数码 的 数量 

在 把 数字 从 十 进 制 转换 到 其 他 进 制 之 前 ， 我 们 需要 知道 数码 的 数量 。 通 过 K=「 logsN | 
的 关系 ， 我 们 总 可 以 找到 一 个 整数 的 数码 的 数量 ， 其 中 [x1 意 味 着 最 小 的 整数 大 于 或 等 于 x 
(这 也 称 为 x 的 高 限 )，N 是 该 整数 的 十 进 制 值 。 例 如 ， 我 们 可 以 找到 十 进 制 数 234 在 所 有 4 
个 系统 中 的 位 数 ， 如 下 所 示 : 

a. 十 进 制 : Ki=「 logio2341=「 2.371=3， 显 而 易 见 。 

b. 二 进 制 : Ki=「 log22341=『「7.8 |]=8， 因 为 234 = (11101010),， 所 以 正确 。 

c. 八进制 : K=[「 logs2341=[「 2.62]=3， 因 为 234 = (352)s， 所 以 正确 。 

d. 十 六 进 制 ， Ki=「 logis2341=「1.961=2， 因 为 234 = (EA)i6。， 所 以 正确 。 

如 果 你 的 计算 器 不 包括 任意 底 的 对 数 运算 ,参见 附录 G 关于 如 何 计算 logsN 的 信息 。 

3. 二 进 制 - 十 六 进 制 的 转换 

我 们 能 轻松 地 将 数字 从 二 进 制 转换 到 十 六 进 制 ， 反 之 亦 然 。 这 是 因为 在 这 两 个 底 之 间 存 
在 一 种 关系 : 二 进 制 中 的 4 位 恰好 是 十 六 进 制 中 的 1 位。 图 2-10 显示 了 该 转换 是 如 何 进 行 的 。 


Bi: 二 进 制 数字 (位 ) H,: 十 六 进 制 数字 





B» B., BB] …，。 |BELBe Bs Bol |B; BB Ba| 二 进 抽 
十 六 进 制 


图 2-10 二 进 制 与 十 六 进 制 的 相互 转换 


2 下 面 演 示 如 何 将 二 进 制 数 (10011100010); 转换 为 十 六 进 制 数 。 

解 ” 我 们 先 将 二 进 制 数 排 成 4 位 一 组 的 形式 ，100 1110 0010。 注 意 最 左边 一 组 可 能 是 1 到 
4 位 不 等 。 根 据 表 2-2 所 示 的 值 对 照 每 4 位 一 组 等 量 转换 得 到 十 六 进 制 数 (4E2)ie。 

与 十 六 进 制 数 (24C)is 相等 的 二 进 制 数 是 多 少 ? 

解 ”将 每 个 十 六 进 制 数 码 转换 成 4 位 一 组 的 二 进 制 数 : 2 一 0010， 4 一 0100， 以 及 
C 一 1100。 该 结果 是 (001001001100);。 

4. 二 进 制 - 八进制 的 转换 

我 们 能 轻松 地 将 数字 从 二 进 制 转换 到 八进制 ， 反 之 亦 然 。 这 是 因为 在 这 两 个 底 之 间 存 在 
一 种 关系 : 二 进 制 中 的 3 位 恰好 是 八进制 中 的 1 位 。 图 2-11 显示 了 该 转换 是 如 何 进 行 的 。 





Bi: 二 进 制 数字 (位 ) 0,: 八进制 数字 





图 2-11 二进制 与 八进制 的 相互 转换 


下 面 演示 如 何 将 二 进 制 数 (101110010); 转换 为 八进制 数 。 

解 每 3 位 一 组 转换 为 1 位 八进制 数码 。 根 据 表 2-2 所 示 的 值 对 照 每 3 位 一 组 等 量 转换 
得 到 八进制 数 (562)s。 

与 (24)s 相等 的 二 进 制 数 是 多 少 ? 

解 ” 将 每 个 八进制 数码 写成 对 等 的 二 进 制 位 组 ， 得 到 (010100):。 

5. 八进制 - 十 六 进 制 的 转换 

将 数字 从 八进制 转换 到 十 六 进 制 并 不 难 ， 反 之 亦 然 。 我 们 可 以 使 用 二 进 制 系统 作为 中 介 
系统 。 图 2-12 显示 了 一 个 例子 。 一 一 

该 步骤 如 下 : 

1 ) 从 八进制 转换 到 十 六 进 制 ， 





数 重 排 成 4 位 一 组 ， 找 到 十 六 进 制 的 
对 等 值 。 

2) 从 十 六 进 制 转换 到 八进制 ， 呈 ee 
先 将 十 六 进 制 转换 到 二 进 制 。 我 们 将 ”图 ?-12 八进制 到 十 六 进 
位 数 重 排 成 3 位 一 组 ， 找 到 八进制 的 对 等 值 。 


数码 的 数量 
从 一 个 底 向 另 一 个 底 转 换 时 ， 如 果 我 们 知道 源 系 统 数码 的 最 大 数量 ， 就 能 知道 目标 系统 


中 所 需 用 到 的 数码 的 最 小 数量 。 例 如 ， 如 果 在 源 系统 中 我 们 知道 最 多 使 用 6 个 十 进 制 数码 ， 
那么 在 目标 系统 中 就 要 知道 使 用 二 进 制 数 码 的 最 小 数量 。 通 常 ， 假 设 在 以 b, 为 底 的 系统 中 
使 用 天 个 数码 ， 在 源 系 统 中 显示 的 最 大 数 是 bf-1。 在 目标 系统 中 可 拥有 的 最 大 数 是 bi-1。 
因此 好 -1 > 外 -1。 这 意味 着 好 二 站， 即 
x SKX(EDAIGEb) RIKX(ogb logb)] 

(EB 找 出 二 进 制 数码 的 最 小 数 ， 用 于 存储 一 个 最 大 6 个 数码 的 十 进 制 整数 。 

解 及 =6, b=10, b=2,， 那么 x=『「 KX (log bi/ log b;)]=『6X(1/ 0.301 03)1=20。 最 
大 的 6 个 数码 的 十 进 制 数 是 999 999， 并 且 最 大 的 20 位 二 进 制 数 是 1 048 575。 注 意 ， 可 以 
用 19 位 表示 的 最 大 的 数 是 524 287， 它 比 999 999 小 。 因 此 我 们 肯定 需要 20 位 。 


2.3” 非 位 置 化 数字 系统 

尽管 非 位 置 化 数字 系统 并 不 用 在 计算 机 中 ， 但 我 们 给 出 简单 的 介绍 ， 以 便 和 位 置 化 数字 
系统 进行 比较 。 非 位 置 化 数字 系统 仍然 使 用 有 限 的 数字 符号 ， 每 个 符号 有 一 个 值 。 但 是 符号 
所 占用 的 位 置 通常 与 其 值 无 关 一 一 每 个 符号 的 值 是 固定 的 。 为 求 出 该 数字 的 值 ， 我 们 把 所 有 
符号 表示 的 值 相 加 。 该 系统 的 数字 表示 为 : 






和 | 2 Re a 十 六 进 制 
制 以 及 十 六 进 制 到 八进制 的 转换 


22 锣 2 擎 


9K-1…'929190， 9_15-2…9- 
并 且 值 为 : 
整数 部 分 小 数 部 分 
n = + ES + “Stor 
与 前 面 提 到 的 相 加 规则 有 一 些 例外 ， 如 例 2-24 所 示 。 
名 罗马 数字 系统 是 非 位 置 化 数字 系统 的 一 个 好 例子 。 该 系统 由 罗马 人 发 明 ， 
并 在 欧洲 一 直 使 用 到 16 世纪 ， 至 今 仍 在 体育 比赛 、 钟 表 刻 度 和 其 他 应 用 中 使 用 。 该 数字 系 
统 有 一 套 符 号 8 = {1, V, X, L, C, D, M} ， 每 个 符号 的 取 值 如 表 2-3 所 示 。 


表 2-3 罗马 数字 系统 的 符号 取 值 


为 求 一 个 数 的 值 ， 我 们 需要 遵循 特定 的 法 则 将 符号 的 值 相 加 : 

1 ) 当 一 个 带 有 较 小 值 的 符号 位 于 一 个 带 有 同等 值 或 较 大 值 的 符号 的 后 面 时 ， 这 些 值 相 加 。 

2 ) 当 一 个 带 有 较 小 值 的 符号 位 于 一 个 带 有 较 大 值 的 符号 的 前 面 时 ， 用 大 值 减 小 值 。 

3 ) 如 果 51 夺 10X5,， 则 符号 5 不 能 出 现在 符号 之 前 。 例 如, I 和 V 不 能 出 现在 C 
前 面 。 

4 ) 对 于 大 数字 ,在 6 种 符号 ( 除 1 以 外 的 所 有 符号 ) 中 的 任意 一 个 上 方 加 横 杠 表示 乘 以 
1000。 例如，V = 5000 和 M = 1 000 000。 

5 ) 尽管 罗马 人 使 用 单词 nulla ( 空 ) 来 表达 零 的 概念 ， 但 罗马 数字 系统 中 缺少 数码 0。 

下 面 显示 了 一 些 罗马 数字 和 它们 的 值 : 





SEE 六 ss 一 i = 
DR — 5-1 = 
YH 一 5+1+1+1 
VE 10+5+1+1+1 _ 
XIX 一 10H10-1) - 
Xi 一 S0+10+10+1+1 
of 一 100+1 机 
MMVIE 1000+1000+5+1l+1 = 
MDG 一 1000+500+100 二 
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有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
® Stalling, W. Computer Organization and Architecture, Upper Saddle River, NJ: Prentice- 


Hall, 2000 
。 Mano, M. Computer System Architecture, Upper Saddle River, NJ : Prentice-Hall,1993 
®° Null, L. and Lobur, J. Computer Organization and Architecture, Sudbury, MA: Jones and 


Bartlett, 2003 
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* Brown, S. and Vranesic, Z. Fundamentals of Digital Logic with Verilog Design, New 
York: McGraw-Hill, 2003 


关键 术语 

base ( 底 ) nonpositional number system ( 非 位 置 化 数字 系统 ) 
binary digit (二 进 制 数码 ) number system (数字 系统 ) 

binary system (二 进 制 系统 ) octal digit (八进制 数码 ) 

bit (位 ) octal system (八进制 系统 ) 

decimal digit (十 进 制 数码 ) place value (位 置 量 ) 

decimal system (十 进 制 系统 ) positional number system (位 置 化 数字 系统 ) 


hexadecimal digit (十 六 进 制 数码 ) radix (基数 ) 
hexadecimal system (十 六 进 制 系统 ) real (实数 ) 
integer (整数 ) Roman number system (罗马 数字 系统 ) 


小 结 

。 数字 系统 (或 数码 系统 ) 是 用 独特 的 符号 来 表示 一 个 数字 的 系统 。 位 置 化 数字 系统 
中 ， 在 数字 中 符号 所 占据 的 位 置 决定 了 其 表示 的 值 。 每 个 位 置 有 一 个 位 置 量 与 其 相关 
联 。 非 位 置 化 数字 系统 使 用 有 限 的 数字 符号 ， 每 个 符号 有 一 个 值 。 但 是 符号 所 占用 的 
位 置 通常 与 其 值 无 关 ， 每 个 符号 的 值 是 固定 的 。 

。 在 十 进 制 系统 中 ,， 底 b= 10 并 且 用 10 个 符号 来 表示 一 个 数 。 该 系统 中 的 符号 常 被 
称 为 十 进 制 数码 或 仅 称 为 数码 。 在 二 进 制 系统 中 ， 底 上 = 2 并 且 用 2 个 符号 来 表示 
一 个 数 。 该 系统 中 的 符号 常 被 称 为 二 进 制 数码 或 位 。 在 十 六 进 制 系统 中 ， 底 b= 16 
并 且 用 16 个 符号 来 表示 一 个 数 。 该 系统 中 的 符号 常 被 称 为 十 六 进 制 数码 。 在 八进制 
系统 中 , 底 = 8 并 且 用 8 个 符号 来 表示 一 个 数 。 该 系统 中 的 符号 常 被 称 为 八进制 
数码 。 

。 可 以 从 任意 进 制 转换 到 十 进 制 。 将 数码 乘 以 其 在 源 系统 中 的 位 置 量 并 求 和 便 得 到 在 
十 进 制 中 的 数 。 我 们 能 够 将 十 进 制 数 转换 到 与 其 等 值 的 任意 进 制 数 。 这 和 需要 两 个 过 
程 ， 一 个 用 于 整数 部 分 ， 另 一 个 用 于 小 数 部 分 。 整 数 部 分 需要 连 除 ， 而 小 数 部 分 需要 
连 乘 。 

。 将 数字 从 二 进 制 转换 到 十 六 进 制 很 容易 ， 反 之 亦 然 。 这 是 因为 二 进 制 中 的 4 位 恰好 是 
十 六 进 制 中 的 1 位 。 

。 将 数字 从 二 进 制 转换 到 八进制 很 容易 ， 反 之 亦 然 。 这 是 因为 二 进 制 中 的 3 位 恰好 是 八 
进 制 中 的 1 位 。 


2.5 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 做 本 章 练 习 前 首先 完成 相 
关 测 验 题 以 检测 对 本 章 内 容 的 理解 。 
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复习 题 


Q2-1 
Q2-2 
Q2-3 


定义 一 个 数字 系统 。 : 
辨析 位 置 化 和 非 位 置 化 数字 系统 。 
定义 位 置 化 数字 系统 中 的 底 或 基数 。 位 置 化 数字 系统 中 ， 底 与 符号 的 数量 有 什么 关系 ? 


Q2-4 ” 简 述 十 进 制 系统 。 为 什么 称 作 十 进 制 ? 该 系统 的 底 是 多 少 ? 
Q2-5 ” 简 述 二 进 制 系统 。 为 什么 称 作 二 进 制 ? 该 系统 的 底 是 多 少 ? 
Q2-6 简 述 八进制 系统 。 为 什么 称 作 八进制 ? 该 系统 的 底 是 多 少 ? 
Q2-7 ” 简 述 十 六 进 制 系统 。 为 什么 称 作 十 六 进 制 ? 该 系统 的 底 是 多 少 ? 
Q2-8 ”为 什么 二 进 制 和 十 六 进 制 相互 转换 很 容易 ? 
Q2-9 十 六 进 制 系统 中 1 个 数码 表示 二 进 制 系统 中 的 几 位 ? 
Q2-10 ”八进制 系统 中 1 个 数码 表示 二 进 制 系统 中 的 几 位 ? 
练习 题 
P2-1 将 下 列 二 进 制 数 转 换 为 十 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. (01101); b. (1011000); c, (011110.01): d. (111111.111); 
P2-2 将 下 列 十 六 进 制 数 转换 为 十 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. (AB2)e b. (123)is c. (ABB)'e d. (35E.E1)e 
P2-3 ”将 下 列 八进制 数 转换 为 十 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. (237)s b. (2731)s c. (617.7)s d. (21.11)s 
P2-4 ”将 下 列 十 进 制 数 转换 为 二 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 ， 
a. 1234 b. 88 c. 124.02 d, 14.56 
P2-5 ”将 下 列 十 进 制 数 转 换 为 八进制 数 ， 不 用 计算 器 并 写 出 计算 过 程 ; 
a. 1156 b. 99 c. 11.4 d. 72.8 
P2-6 ”将 下 列 十 进 制 数 转换 为 十 六 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. 567 b. 1411 c. 12.13 d. 16 
P2-7 将 下 列 八 进 制 数 转换 为 十 六 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. (514)s b. (411)s c. (13.7)s d. (1256)s 
P2-8 将 下 列 十 六 进 制 数 转换 为 八进制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. (S51A)is b. (4E1),s c. (BB.C)'s d. (ABC.D)r 
P2-9 将 下 列 二 进 制 数 转换 为 八进制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. (01101)， b. (1011000); c, (011110.01); d. (111111.111); 
P2-10 ”将 下 列 二 进 制 数 转换 为 十 六 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. (01101); b. (1011000); c. (011110.01); d, (111111.111); 
P2-11 将 下 列 十 进 制 数 转换 为 二 进 制 数 ， 使 用 例 2-17 中 讨论 的 另 一 种 方法 ， 并 写 出 计算 过 程 : 
a, 121 b. 78 G233 d. 214 
P2-12 将 下 列 十 进 制 数 转换 为 二 进 制 数 ， 使 用 例 2-18 中 讨论 的 男 一 种 方法 ， 并 写 出 计算 过 程 : 
a. 3 b. 1232 c. 4564 d, 12312 
P2-13 ”在 底 为 b 的 位 置 化 数字 系统 中 ， 可 用 个 数码 表示 的 最 大 整数 数字 是 b*-1。 分 别 找 出 以 下 系 
统 中 使 用 6 个 数码 的 最 大 数字 : 
a. 二 进 制 b. 十 进 制 c. 十 六 进 制 d. 八进制 
P2-14 不 进行 转换 ， 找 出 下 面 各 种 情况 下 目标 系统 中 所 需 的 最 少数 码 数量 : 
a. 5 个 十 进 制 数码 转换 为 二 进 制 b. 4 个 十 进 制 数码 转换 为 八进制 


c. 7 个 十 进 制 数码 转换 为 十 六 进 制 


P2-15 


P2-16 


P2-17 


P2-18 


P2-19 


P2-20 


P2-21 


P2-22 


P2-23 


P2-24 


P2-25 


P2-26 
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不 进行 转换 ， 找 出 下 面 各 种 情况 下 目标 系统 中 所 需 的 最 少数 码 数 量 : 

a.5 位 二 进 制 数码 转换 为 十 进 制 b. 3 个 八进制 数码 转换 为 十 进 制 
c. 3 个 十 六 进 制 数码 转换 为 十 进 制 

下 表 显 示 如 何 重 写 小 数 ， 使 其 分 母 是 2 的 寡 次 (1 2, 4, 8, 16 等 等 )。 


0 025 in 
0125 wn | os ~ In 


但 是 ， 我 们 有 时 需要 组 合 它们 以 得 到 合适 的 小 数 。 例 如 ，0.625 是 0.5+0.125。 这 就 意味 0.625 
可 以 写成 /+1 或 :As。 
将 下 列 十 进 制 小 数 改 写 为 带 2 的 短 次 的 小 数 ; 


a. 0.1875 b. 0.640 625 c. 0.406 25 d. 0.375 
使 用 前 面 的 解 题 方 法 ， 把 下 列 数 转换 为 二 进 制 数 : 

a. 7.1875 b. 12.640 625 c. 11.406 25 d. 0.375 

找 出 下 列 情形 的 整数 最 大 值 : 

a.b=10, K=10  b.b=2, K=12 c.b=8, K=8 d.b=16, K=7 
找 出 用 于 存储 下 列 整数 所 需 的 最 小 位 数 : 

a. 小 于 1000 b. 小 于 100 000 c. 小 于 64 d. 小 于 256 
一 个 小 于 b” 的 数 可 以 用 以 2 为 底 的 天 个 数码 表示 。 求 下 列 情况 下 需要 的 数码 数量 : 

a. 小 于 2 ”的 二 进 制 整数 b. 小 于 10 的 十 进 制 整数 

c. 小 于 8” 的 八进制 整数 d. 小 于 16 的 十 六 进 制 整数 


一 个 用 于 因特网 的 公共 底 是 b= 256。 我 们 使 用 256 个 符号 来 表示 该 系统 中 的 数字 。 设 计 者 
使 用 十 进 制 数字 0 到 255 来 表示 其 中 一 个 符号 ， 而 不 是 创建 大 量 的 新 符号 。 也 就 是 说 ， 符 
号 集 是 8 = {0, 1, 2, 3,…, 255}。 该 系统 中 的 数字 总 是 以 51.52.53.54 这 种 4 个 符号 间隔 3 个 点 
的 形式 出 现 。 该 系统 用 于 定义 因特网 的 网 址 (人 参见 第 6 章 )。 例 如 ， 该 系统 中 的 一 个 地 址 是 
10.200.14.72， 等 价 于 十 进 制 中 的 10X2563+200 x 256?+14 x 256'+72 x 256"=180 883 016。 这 
个 数字 系统 称 为 点 十 进 制 计数 法 。 写 出 下 列 因 特 网 地 址 的 十 进 制 数 值 ; 

a. 17.234.34.14 b. 14.56.234.56 c, 110.14.56.78 d. 24.56.13.11 

前 面 问题 中 因特网 地 址 也 可 以 表示 为 位 模式 。 这 种 情况 下 ， 用 32 位 表示 一 个 地 址 。 在 点 十 
进 制 计数 法 中 的 一 个 符号 用 8 位 。 例 如 ， 地 址 10.200.14.72 也 可 表示 为 00001010 11001000 
00001110 01001000。 用 位 表示 下 列 因特网 地 址 : 


a. 17.234.34.14 b. 14.56.234.56 c. 110.14.56.78 d. 24.56.13.11 
写 出 下 列 罗马 数字 的 等 值 十 进 制 数 : 

a. XV b. XXV I c. VL I d. MCLV 工 
把 下 列 十 进 制 数 转 换 成 罗马 数字 : 

本 b. 38 c, 82 d. 999 

找 出 下 列 有 错 的 罗马 数字 : 

a. MMIM b. MIC 6 GVYC d. VX 


玛雅 文明 发 明了 位 置 化 的 二 十 进 制 ( 以 20 为 底 ) 数字 系统 ， 称 为 玛雅 数字 系统 。 他 们 用 20 为 
底 ， 可 能 是 因为 他 们 使 用 手指 和 脚趾 一 起 来 计数 。 该 系统 使 用 的 20 个 符号 建立 在 3 个 更 简单 
的 符号 之 上 。 该 系统 的 先进 特征 在 于 它 有 符号 0， 这 是 一 个 外 壳 。 另 外 2 个 符号 是 一 个 圈 (或 
一 个 鹅卵石 ) 表示 1， 以 及 一 个 横 杆 (或 一 个 棍子 ) 表示 5。 为 了 表示 大 于 19 的 数字 ， 数 字 竖 
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写 。 在 因特网 上 搜索 以 下 问题 的 答案 : 十 进 制 数 12、123、452 和 1256 在 玛雅 数字 系统 中 是 
什么 ? 

巴比伦 文明 发 明了 首 个 位 置 化 数字 系统 ， 称 为 巴比伦 数字 系统 。 他 们 继承 了 闪 族 人 和 阿 卡 得 
人 的 数字 系统 ， 将 其 发 展 为 位 置 化 的 六 十 进 制 (以 60 为 底 ) 数字 系统 。 该 底 现今 还 用 于 时 间 
和 角度。 例如 ,. 1 小 时 为 60 分 钟 ，! 分 钟 为 60 秒 。 同 样 ，! 度 为 60 分 ，1 分 为 60 秒 。 底 为 b 
的 位 置 化 系统 需要 2 个 符号 (数码 )， 我 们 希望 一 个 位 置 化 的 六 十 进 制 系统 有 60 种 符号 。 但 是 
巴比伦 人 没有 符号 0， 而 且 通 过 堆 司 表示 1 和 10 的 2 个 符号 构造 出 其 他 59 个 符号 。 在 因特网 
上 搜索 以 下 问题 的 答案 : 

a. 用 巴比伦 数字 表示 十 进 制 数 : 11 291, 3646, 3582。 

b. 指出 没有 符号 0 可 能 出 现 的 问题 。 巴 比 伦 数字 系统 是 如 何 解 决 这 个 问题 的 ? 
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数据 存储 


正如 第 1 章 所 述 ， 计 算 机 是 一 个 可 编程 的 数据 处 理 机 器 。 在 谈论 处 理 数据 之 前 ， 我 们 需 
要 理解 数据 的 特性 。 在 本 章 中， 我们 将 讨论 不 同 的 数据 类 型 以 及 它们 是 如 何 存储 在 计算 机 中 
的 。 第 4 章 将 讲解 计算 机 内 部 是 如 何 控制 数据 的 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 列 出 计算 机 中 使 用 的 5 种 不 同 的 数据 类 型 ， 

。 描述 不 同 的 数据 如 何以 位 模式 存储 在 计算 机 内 部 ; 

。 描述 整数 如 何以 无 符号 格式 存储 在 计算 机 中 ; 

。 描述 整数 如 何以 符号 加 绝对 值 格式 存储 在 计算 机 中 ; 

。 描述 整数 如 何以 二 进 制 补 码 格 式 存储 ; 

。 描述 实数 如 何以 浮 点 格式 存储 在 计算 机 中 ; 

。 描述 文本 如 何 通 过 各 种 不 同 的 编码 系统 存储 在 计算 机 中 ; 

。 描述 音频 如 何 通 过 采样 、 量 化 和 编码 存储 在 计算 机 中 ; 

。 描述 图 像 如 何 通 过 光栅 和 矢量 图 模式 存储 在 计算 机 中 ; 

。 描 述 视 频 如 何以 图 像 随时 间 变 化 的 表示 存储 在 计算 机 中 。 


3.1 数据 类 型 
如 今 ， 数 据 以 不 同 的 形式 出 现 ， 如 数字 、 文 本 、 音 频 、 图 像 和 视频 (图 3-1 )。 





图 3-1 不 同类 型 的 数据 


人 们 需要 能 够 处 理 许 多 不 同 的 数据 类 型 . 
。 工程 程序 使 用 计算 机 的 主要 是 目的 是 处 理 数字 : 进行 算术 运算 、 求 解 代数 或 三 角 方 


程 、 找 出 微分 方程 的 根 等 。 
。 与 工程 程序 不 同 的 是 ， 文 字 处 理 程序 使 用 计算 机 的 主要 目的 是 处 理 文 本 : 调整 对 齐 、 


移动 、 删 除 等 。 
。 计 算 机 同样 也 处 理 音频 数据 。 我 们 可 以 使 用 计算 机 播放 音乐 ， 并且 可 以 把 声音 作为 数 


据 输入 到 计算 机 中 。 
。 图 像 处 理 程序 使 用 计算 机 的 主要 目的 是 处 理 图 像 : 创建 、 收 缩 、 放 大 、 旋 转 等。 
。 最 后 ， 计 算 机 不 仅 能 用 来 播放 电影， shelndet 


“计算 机 行业 中 使 用 术语 “多 媒体 ”来 定义 包含 数字 
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3.1.1 计算 机 内 部 的 数据 
所 有 计算 机 外 部 的 数据 类 型 的 数据 都 采用 统一 的 数据 表示 法 转换 后 存 人 计算 机 中 ， 当 数 
据 从 计算 机 输出 时 再 还 原 回 来 。 这 种 通用 的 格式 称 为 位 模式 。 


1. 位 
位 ( bit，binary digit 的 缩写 ) 是 存储 在 计算 机 中 的 最 小 单位 ， 它 是 0 或 1。 位 代表 设备 


的 某 一 状态 ， 这 些 设备 只 能 处 于 两 种 状态 之 一 。 例 如 ， 开 关 要 么 合 上 要 么 断 开 。 用 1 表示 合 
上 状态 ，0 表 示 断 开 状态 ， 或 者 相反 。 电 子 开关 就 表示 一 个 位 。 换 句 话 说， 一 个 开关 能 存储 
一 个 位 的 信息 。 今 天 ， 计算机 使 用 各 种 各 样 的 双 态 设备 来 存储 数据 。 


2. 位 模式 
为 了 表示 数据 的 不 同类 型 ， 应 该 使 用 位 模式 ， 它 是 一 个 序列 ， 有 时 也 被 称 为 位 流 。 


图 3-2 展示 了 由 16 个 位 组 成 的 位 模式 。 它 是 0 和 1 的 组 合 。 这 就 意味 着 ， 如 果 我 们 需要 存 
储 一 个 由 16 个 位 组 成 的 位 模式 ， 那 么 需要 16 个 电子 开关 。 如 果 

我 们 需要 存储 1000 个 位 模式 ， 每 个 16 位 ， 那 么 需要 16 000 个 开 
关 。 通 常 长 度 为 8 的 位 模式 被 称 为 1 字 节 。 有 时 用 字 这 个 术语 指 图 3-2 位 模式 


代 更 长 的 位 模式 。 
正如 图 3-3 所 示 ， 属 于 不 同 数据 类 型 的 数据 可 以 以 同样 的 模式 存储 于 内 存 中 。 





图 3-3 不 同 数据 类 型 的 存储 


如 果 使 用 文本 编辑 器 (文字 处 理 器 )， 键 盘 上 的 字符 A 可 以 以 8 位 模式 01000001 存储 。 
如 果 使 用 数学 程序 ， 同 样 的 8 位 模式 可 以 表示 数字 65。 类 似 地 ， 同 样 的 位 模式 可 表示 部 分 
图 像 、 部 分 歌曲 、 影 片 中 的 部 分 场景 。 计 算 机 内 存 存 储 所 有 这 些 而 无 须 辨别 它们 表示 的 是 何 


种 数据 类 型 。 


3.1.2 数据 压缩 


为 占用 较 少 的 内 存 空 间 ， 数 据 在 存储 到 计算 机 之 前 通常 会 被 压缩 。 数 据 压 缩 是 一 个 很 宽 
泛 的 主题 ， 所 以 我 们 用 整个 第 15 章 来 讲述 。 
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3.1.3 ”错误 检测 和 纠正 


为 一 个 与 数据 有 关 的 话题 是 在 传输 与 存储 数据 时 的 错误 检测 和 纠正 。 我 们 将 在 附录 H 
中 简要 讨论 这 个 话题 。 ' 


FT rm, 


RE Se 
3.2 ”存储 数字 
在 存储 到 计算 机 内 存 中 之 前 ， 数 字 会 被 转换 到 二 进 制 系 统 ， 如 第 2 章 所 述 。 但 是 ， 这 里 
还 有 两 个 问题 需要 解决 ; 


1 ) 如 何 存储 数字 的 符号 。 

2 ) 如 何 显示 十 进 制 小 数 点 。 

有 多 种 方法 可 处 理 符号 问题 ， 本 章 后 面 会 陆续 讨论 。 对 于 小 数 点 ， 计 算 机 使 用 两 种 不 同 
的 表示 方法 : 定点 和 浮 点 。 第 一 种 用 于 把 数字 作为 整数 存储 一 一 没有 小 数 部 分 ， 第 二 种 把 数 


字 作 为 实数 存储 一 一 带 有 小 数 部 分 。 


3.2.1 存储 整数 
整数 是 完整 的 数字 ( 即 没 有 小 数 部 分 )。 例 如 ，134 和 -125 是 整数 而 134.23 和 -0.235 
则 不 是 。 整 数 可 以 被 当 作 小 数 点 位 置 固定 的 数字 : 小 数 点 固定 在 最 右边 。 因 此 ， 定 点 表示 法 
用 于 存储 整数 ， 如 图 3-4 所 示 。 在 这 种 表示 法 中 ， 小 数 点 是 假定 的 ， 但 并 不 存储 。 
LoLillollliIlioiololLlloiollllioje 
存储 单元 /存储 器 位 置 | 


十 进 制 小 数 点 
【假定 的 位 置 ) 


图 3-4 整数 的 定点 表示 法 


但 是 ， 用 户 (或 程序 ) 可 能 将 整数 作为 小 数 部 分 为 0 的 实数 存储 。 这 是 可 能 发 生 的 ， 例 
如 ， 整 数 太 大 以 至 于 无 法 定义 为 整数 来 存储 。 为 了 更 有 效 地 利用 计算 机 内 存 ， 无 符号 和 有 符 
号 的 整数 在 计算 机 中 的 存储 方式 是 不 同 的 。 
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1, 无 符号 表示 法 


无 符号 整数 是 只 包括 零 和 正 数 的 非 负 整数 。 它 的 范围 介 于 0 到 无 穷 大 之 间 。 然 而 ， 由 
于 计算 机 不 可 能 表示 这 个 范围 的 所 有 整数 ， 通 常 计算 机 都 定义 了 一 个 常量 ， 称 为 最 大 无 
符号 整数 ， 它 的 值 是 (2-1 )。 这 里 就 是 计算 机 中 分 配 用 于 表示 无 符号 整数 的 二 进 制 
位 数 。 

存储 无 符号 整数 

输入 设备 使 用 以 下 步 又 存储 无 符号 整数 : 

1 ) 首先 将 整数 变 成 二 进 制 数 。 

2 ) 如 果 二 进 制 位 数 不 足 位， 则 在 二 进 制 数 的 左边 补 0， 使 它 的 总 位 数 为 n 位 。 如 果 
位 数 大 于 n， 该 整数 无 法 存储 。 这 会 导致 溢出 情况 发 生 ， 我 们 后 面 要 讨论 。 
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网 =< 将 7 存储 在 8 位 存储 单元 中 ， 使 用 无 符号 表示 法 。 

解 ”首先 将 数字 转换 为 二 进 制 数 (111D):。 加 5 个 0 使 总 的 位 数 为 8 位 ， 即 (00000111);。 
nd 注意 ， 右 下 角 的 2 用 于 强调 该 整数 是 二 进 制 的 ， 并 不 存储 在 
计算 机 中 。 

把 7 变 为 二 进 制 py 
在 左边 加 5 位 一 OF OF OO ON rT1 
将 258 存储 在 16 位 存储 单元 中 。 

解 ” 首 先 把 数字 转换 为 二 进 制 数 (100000010):。 加 7 个 0 使 总 的 位 数 满足 16 位 的 要 求 ， 

即 得 到 (0000000100000010),。 再 将 该 整数 存储 在 存储 单元 中 。 








把 258 变 为 二 进 制 一 | lO O08: Os OR OW0 70 
在 左边 加 7 位 —» "ON020 0:0 ON OI O00uOEO0:10 
译 解 无 符号 整数 


输出 设备 译 解 内 存 中 位 模式 的 位 串 并 将 其 转换 为 一 个 十 进 制 的 无 符号 整数 。 





解 ” 使 用 第 2 章 的 解 题 过 程 ， 二 进 制 整数 转换 为 十 进 制 无 符号 整数 43。 

溢出 

因为 大 小 ( 即 存 储 单元 的 位 的 数量 ) 的 限制 ， 可 以 表达 的 整数 范围 是 有 限 的 。 在 nt 位 存 
储 单元 中 ， 我 们 可 以 存储 的 无 符号 整数 仅 
为 0 到 2" - 1 之 间 。 图 3-5 显示 了 如 果 存 EEN 
储 大 于 24 -- 1 = 15 的 整数 到 仅 为 4 位 的 内 人 和 洲 等 订 ee i 3 
存 中 所 发 生 的 情况 。 例 如 ， 保 存 整 数 1] 
在 存储 单元 中 ， 又 试图 再 加 上 9， 就 会 发 
生 这 种 称 为 溢出 的 情况 。 表 示 十 进 制 数 20 
的 最 小 位 数 是 5 位 ， 即 20 = (10100)2， 所 
以 计算 机 丢掉 最 左边 的 位 ， 并 保留 最 右边 
的 4 位 (0100)a。 当 人 们 看 到 新 的 整数 显示 








为 4 而 不 是 20 时 很 惊讶 。 图 3-5 显示 了 00 ft ol10 
为 什么 会 发 生 这 种 情况 。 图 3-5 无 符号 整数 的 滋 出 
无 符号 整数 的 应 用 


无 符号 整数 表示 法 可 以 提高 存储 的 效率 ， 因 为 不 必 存 储 整数 的 符号 。 这 就 意味 着 所 有 分 
配 的 位 单元 都 可 以 用 来 存储 数字 。 只 要 用 不 到 负 整 数 ， 都 可 以 用 无 符号 整数 表示 法 。 具 体 情 
况 如 下 : 

。 计数 : 当 我 们 计数 时 ， 不 需要 负数 。 可 以 从 1 (有 时 0 ) 开始 增长 。 

。 寻 址 : 有 些 计算 机 语言 在 一 个 存储 单元 中 存储 另 一 个 存储 单元 的 地 址 。 地 址 都 是 从 0 
(存储 器 的 第 一 个 字 节 ) 开始 到 整个 存储 器 的 总 字 节 数 的 正 数 ， 在 这 里 同样 也 不 需要 
用 到 负数 。 因 此 无 符号 整数 可 以 轻松 地 完成 这 个 工作 。 

。 存储 其 他 数据 类 型 : 我 们 后 面 将 谈 到 的 其 他 数据 类 型 (文本 、 图 像 、 音 频 和 视频 ) 是 
以 位 模式 存储 的 ， 可 以 翻译 为 无 符号 整数 。 


发 据闻 和 也 


2. 符号 加 绝对 值 表示 法 
尽管 符号 加 绝对 值 表 示 法 格式 在 存储 整数 中 并 不 常用 ， 但 该 格式 用 于 在 计算 机 中 存储 


部 分 实数 ， 正 如 下 一 节 所 述 。 因 此 ， 我 们 在 这 里 简要 讨论 该 格式 。 在 这 种 方法 中 ， 用 于 无 符 
号 整数 的 有 效 范围 (0 到 2” -1 ) 被 分 成 两 个 相等 的 子 范围 。 前 半 个 表示 正 整数 ， 后 半 个 表 
示 负 整数 。 例 如 , 为 4， 该 范围 是 0000 到 1111。 这 个 范围 被 分 为 两 半 : 0000 到 0111 以 及 
1000 到 1111 (图 3-6 )。 这 种 位 模式 赋值 为 正 的 和 负 的 整数 。 注 意 ， 负 数 出 现在 正 数 的 右边 ， 
与 常规 的 关于 正 负数 的 思维 相反 。 还 要 注意 该 系统 中 有 两 个 0: 正 0(0000 ) 和 负 0 (1000)。 





0000 0001 0010 0011 0100 0101 0110 0111|1000° 100 
s 6 


图 3-6 符号 加 绝对 值 的 表示 法 


用 符号 加 绝对 值 格式 存储 一 个 整数 ， 需 要 用 1 个 二 进 制 位 表示 符号 (0 表示 正 ，! 表示 
负 )。 这 就 意味 着 在 一 个 8 位 存储 单元 中 ， 可 以 仅 用 7 位 表示 数字 的 绝对 值 (不 带 符号 )。 因 
此 ， 最 大 的 正 数 值 仅 是 无 符号 最 大 数 的 一 半 。 在 nn 位 单元 可 存储 的 数字 范围 是 -(2”-1) 至 
+(2” -1)，7 位 单元 中 最 左 位 分 配 用 于 存储 符号 (0 表示 正 ， Eee 


“ 在 符号 加 绝对 值 表示 法 中 ， 最 左 位 用 于 定义 整数 的 符号 * 0 表示 下 


下 整数 ,1 表示 人 ES 数 。 

用 符号 加 绝对 值 表示 法 将 +28 存储 在 8 位 存储 单元 中 
解 ” 先 把 该 整数 转换 成 7 位 的 二 进 制 数 。 最 左边 位 置 0， 即 存储 为 8 位 数 。 

把 28 变 为 7 位 的 二 进 制 0 0 lis: 1 70°50 

加 符号 位 并 存储 0 ONO Mad 00 
包 攻 区” 用 符号 加 绝对 值 表 示 法 将 -28 存储 在 8 位 存储 单元 中 。 
解 ” 先 把 该 整数 转换 成 7 位 的 二 进 制 数 。 最 左边 位 置 1， 即 存储 为 8 位 数 。 

把 28 变 为 7 位 的 二 进 制 ld 0 

加 符号 位 并 存储 1 OO 0 “0 
将 用 符号 加 绝对 值 表 示 法 存储 的 01001101 复原 成 整数 。 
解 ” 因 为 最 左 位 是 0， 符 号 为 正 。 其 余 位 ( 1001101 ) 转换 成 十 进 制 数 77。 加 上 符号 后 


该 整数 是 +77。 
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岂 蝶 往外 ”将 用 符号 加 绝对 值 表示 法 存储 的 10100001 复原 成 整数 。 
解 ” 因 为 最 左 位 是 1， 符 号 为 负 。 其 余 位 (0100001 ) 转换 成 十 进 制 数 33。 加 上 符号 后 


该 整数 是 -33。 
符号 加 绝对 值 表示 法 的 溢出 
同 无 符号 整数 一 样 ， 有 符号 的 整数 也 会 溢出 。 但 是 ， 这 时 我 们 可 能 有 正 负 两 种 滋 出 情 


况 。 图 3-7 显示 了 当 使 用 4 位 内 存单 元 存储 一 个 用 符号 加 绝对 值 表示 法 的 整数 时 出 现 的 正 负 
两 种 溢出 。 当 我 们 试图 存储 一 个 比 7 大 的 正 整数 时 ， 出 现 正 溢出 。 例 如 ， 我 们 保存 整数 5 在 
存储 单元 中 ， 又 试图 再 加 上 6。 我 们 期 望 结 果 是 11, 但 计算 机 响应 为 -3。 这 是 因为 在 一 个 
循环 的 表示 中 ， 从 5 开始 顺 时 针 走 6 个 单位 ， 就 停 在 -3。 一 个 正 数 洲 出 将 整数 限制 在 该 范 


围 中 。 











可 表示 ( 负数 ) | | 可 表示 ( 非 负数 ) 


ll 3 -2 -1 01 2 3 …7 …1 
a) 符号 加 绝对 值 格式 的 整数 的 线性 特征 








1000 0 1000 0111 
b) 负 滋 出 c) 正 滋 出 


3-7 符号 加 绝对 值 表示 法 的 游 出 


当 我 们 试图 存储 一 个 比 -7 小 的 负 整 数 时 ， 出 现 负 溢 出 。 例 如， 我 们 保存 整数 -5 在 存 
储 单元 中 ， 又 试图 再 减 去 7。 我 们 期 望 结果 是 -12， 但 计算 机 响应 为 +6。 这 是 因为 在 一 个 循 
i 从 -5 开始 逆 时 针 走 7 个 单位 ， 就 停 在 +6 了 。 

宪 符 写 加 弛 对 慎 妥 未 法 中 ,有 商 个 0: +0 和 Oo 

符号 加 绝对 值 表 示 法 的 应 用 

符号 加 绝对 值 表示 法 不 用 于 存储 整数 ， 而 用 于 存储 部 分 实数 ， 我 们 后 面 会 看 到 。 男 外 ， 
符号 加 绝对 值 表示 法 通常 用 于 采样 模拟 信和 号， 例如， 音频 。 

3. 二 进 制 补 码 表 示 法 

几乎 所 有 的 计算 机 都 使 用 二 进 制 补 码 表示 法 来 存储 位 于 位 存储 单元 中 的 有 符号 整数 。 
这 一 方法 中 ， 无 符号 整数 的 有 效 范围 (0 到 2"- 1) 被 分 为 两 个 相等 的 子 范围 。 第 一 个 子 范 
围 用 来 表示 非 负 整数 ， 第 二 个 子 范围 用 来 表示 负 整 数 。 例 如 ， 如 果 nn 是 4， 该 范围 是 0000 
到 1111。 这 个 范围 分 为 两 半 : 0000 到 0111 以 及 1000 到 1111。 这 两 半 按 照 左 负 右 正 的 常规 
互相 交换 。 赋 值 给 负 和 非 负 ( 零 和 正 ) 整数 的 位 模式 如 图 3-8 所 示 。 


0000 0001 0010 0011 0100 0101 0110 0111 | 1000.T00LIOIOSIOHLIHOO 1101° 1110 111T 
G1101 1110 1111|0000 0001 0010 0011 0100 0101 0110 0111 


We ol A 1 NW § 3 
图 3-8 ”二进制 补 码 表 示 法 


尽管 整数 的 符号 影响 二 进 制 整数 存储 时 的 每 一 位 ， 但 是 首位 (最 左 位 ) 决定 符号 。 如 果 
最 左 位 是 0， 该 整数 非 负 ; 如 果 最 左 位 是 1， 该 整数 是 负数 。 


a 最 友 位 决定 符号 。 nA | nt. 


Hi 人 i 


pr 
, par 
: ye - Sy 区 人 
it J | Em A 2 SR Kt es ,ve wh i 】 i > 二 pew Fi 各 信人 | 
1 tS po rh ob ve @ ph pe _ ts > é 


Ee 省 











两 种 运算 
在 深信 人 讨论 这 种 表示 法 之 前 ， 我 们 需要 介绍 两 种 运算 。 第 一 种 称 为 反 码 或 取 一 个 整数 的 
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反 码 。 该 运算 可 以 应 用 于 任何 整数 ， 无 论 是 正 的 还 是 负 的 。 该 运算 简单 反 转 各 个 位 ， 即 把 0 
位 变 为 1 位 ,把 1 位 变 为 0 位 。 
下 面 显示 我 们 如 何 取 整 数 00110110 的 反 码 。 


原来 的 模式 OECD 
进行 反 码 运算 1100100 1 
下 面 显示 我 们 如 果 进 行 2 次 反 码 运算 ， 就 可 以 得 到 原先 的 整数 。 
原来 的 模式 0 -0 
进行 1 次 反 码 运算 1 
进行 2 次 反 码 运 算 1 Wi PE et 


第 二 种 运算 称 为 二 进 制 中 的 补 码 或 取 一 个 整数 的 补 码 。 该 运算 分 为 两 步 : 首先 ， 从 右边 
复制 位 ， 直 到 有 1 被 复制 ; 接着 ， 反 转 其 余 的 位 。 

下 面 显示 我 们 如 何 取 整 数 00110100 的 补 码 。 

原来 的 模式 gt 

进行 1 次 补 码 运算 WE 0 0 

例 3-11 下 三 示 我们 如 果 过 行 次 和 和 和 就 可 以 得 到 原先 的 整数 。 

原来 的 模式 0 

进行 1 次 补 码 运 算 

进行 2 次 补 码 运算 站 

另 一 种 将 整数 进行 ; 补 碍 运算 的 方法 是 先 对 它 进行 1 次 反 码 运算 再 加 上 1 得 到 结果 (参见 
第 4 章 的 二 进 制 加 法 )。 

以 二 进 制 补 码 格式 存储 整数 

以 二 进 制 补 码 格式 存储 整数 ， 计 算 机 遵循 以 下 步骤 ， 

。 将 整数 变 成 位 的 二 进 制 数 。 

。 如 果 整 数 是 正 数 或 零 ， 以 其 原样 存储 ; 如 果 是 负数 ， 计 算 机 取 其 补 码 存储 。 

从 二 进 制 补 码 格式 还 原 整数 

从 二 进 制 补 码 格式 还 原 整数 ， 计 算 机 遵循 以 下 步骤 : 

。 如果 最 左 位 是 1， 计算机 取 其 补 码 。 如 果 最 左 位 是 0， 计算 机 不 进行 操作 。 

。 计算机 将 该 整数 转换 为 十 进 制 。 

用 二 进 制 补 码 表示 法 将 整数 28 存储 在 8 位 存储 单元 中 。 

解 ”该 整数 是 正 数 (无 符号 意味 是 正 的 )， 因 此 在 把 该 整数 从 十 进 制 转 换 成 二 进 制 后 不 
再 需要 其 他 操作 。 注 意 ，3 个 多 余 的 零 加 到 该 整数 的 左边 使 其 成 为 8 位 。 

ra 了 
用 二 进 制 补 码 表示 法 将 整数 -28 存储 在 8 位 存储 单元 中 。 
角 该 整数 是 负数 ， 因此 在 转换 成 二 进 制 后 计算 机 对 其 进行 二 进 制 补 码 运算 。 
把 28 变 为 8 位 的 二 进 制 0 0 
进行 补 码 运算 
将 用 二 进 制 补 码 表示 法 存储 在 8 位 存储 单元 中 的 00001101 还 原 成 整数 。 
~ 最 左 位 是 0， 因此 符号 为 正 。 该 整数 需要 转换 为 十 进 制 并 加 上 符号 即 可 。 
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最 左 位 是 0， 符 号 为 正 Rk A oh en i 
整数 转换 为 十 进 制 13 
加 上 符号 (可 选 ) +13 


将 用 二 进 制 补 码 表示 法 存储 在 8 位 存储 单元 中 的 11100110 还 原 成 整数 。 
解 ”最 左 位 是 1， 因 此 符号 为 负 。 在 整数 转换 为 十 进 制 前 进行 补 码 运算 。 


最 左 位 是 1， 符 号 为 负 区 让 ROSE 
进行 补 码 运算 1 0 
整数 转换 为 十 进 制 26 
加 上 符号 -26 


二 进 制 补 码 表示 法 很 有 趣 的 一 点 是 该 表示 法 仅 有 一 个 0， 而 符号 加 绝对 值 表 示 法 则 有 两 
个 0 (+0 和 -0 )。 

二 进 制 补 码 表示 法 仅 有 一 个 0 - 

二 进 制 补 码 表示 法 的 溢出 

同 其 他 表示 法 一 样 ， 以 二 进 制 补 码 表示 法 存储 的 整数 也 会 溢出 。 图 3-9 显示 了 当 使 用 4 
位 存储 单元 存储 一 个 带 符号 的 整数 时 出 现 的 正 负 两 种 溢出 。 当 我 们 试图 存储 一 个 比 7 大 的 正 
整数 时 ， 出 现 正 溢出 。 例 如 ， 我 们 保存 整数 5 在 存储 单元 中 ， 又 试图 再 加 上 6。 我 们 期 望 结 
果 是 11， 但 计算 机 响应 为 -5。 这 是 因为 在 一 个 循环 的 表示 中 ， 从 5 开始 顺 时 针 走 6 个 单位 ， 





001 011 
1000 0111 
负 洲 出 
图 3-9 ”二进制 补 码 表示 法 的 滋 出 


当 我 们 试图 存储 一 个 比 -8 小 的 负 整数 时 ， 出 现 负 溢出 。 例 如 ， 我 们 保存 整数 -3 在 存 
储 单元 中 ， 又 试图 再 减 去 7。 我 们 期 望 结果 是 -10， 但 计算 机 响应 为 +6。 这 是 因为 在 一 个 循 
环 的 表示 中 ， 从 -3 开始 逆 时 针 走 7 个 单位 ， 就 停 在 +6 了 。 

二 进 制 补 码 表示 法 的 应 用 

当今 ， 二 进 制 补 码 表示 法 是 计算 机 中 用 于 存储 整数 的 标准 表示 法 。 在 下 一 章 中 ， 当 你 发 
现 使 用 二 进 制 补 码 带 来 运算 上 的 简便 后 就 会 明白 为 什么 这 么 说 。 


3.2.2 3 种 系统 的 比较 
表 3-1 显示 了 无 符号 、 二 进 制 补 码 和 符号 加 绝对 值 表示 法 的 对 比 。4 位 存储 单元 可 以 存 
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储 0 一 15 之 间 的 无 符号 整数 ， 同 样 的 存储 单元 可 以 存储 -8 一 +7 之 间 的 二 进 制 补 码 整 数 。 我 
们 要 用 同样 的 格式 存储 和 还 原 整 数 ， 这 一 点 很 重要 。 例 如 ， 如 果 把 13 存 为 有 符号 格式 的 ， 
就 需要 将 其 还 原 成 有 符号 格式 的 ， 同 样 以 二 进 制 补 码 格式 的 -3 可 以 还 原 到 原样 。 


表 3-1 整数 表示 法 小 结 


me 说 
mm | oo | 有 
| 7 
mo | 2 | | or | 2 | 
| | | | | | 
Tr EE | 
wr | | 
mo | | | 
minwlwlwl，l 


3.2.3 ”实数 


实数 是 带 有 整数 部 分 和 小 数 部 分 的 数字 。 例 如 ，23.7 是 一 个 实数 一 一 整数 部 分 是 23 而 
小 数 部 分 是 7110。 尽 管 固定 小 数 点 的 表示 法 可 用 于 表示 实数 ， 但 结果 不 一 定 精确 或 达 不 到 需 
要 的 精度 。 以 下 两 个 例子 说 明了 原因 。 

Kl 在 十 进 制 系统 中 ,假定 我 们 用 一 种 小 数 点 右边 2 个 数码 、 左 边 14 个 数码 ， 
总 共 16 个 数码 的 定点 表示 法 。 那 么 如 果 试 图 表示 十 进 制 数 1.002 34， 该 系统 的 实数 精度 就 
会 受 损 。 该 系统 把 这 个 数字 存储 为 1.00。 

在 十 进 制 系统 中 ， 假 定 用 一 种 小 数 点 右边 6 个 数码 、 左 边 10 个 数码 ， 总 共 
16 个 数码 的 定点 表示 法 。 那 么 如 果 试 图 表示 十 进 制 数 236 154 302 345.00， 该 系统 的 实数 精 
度 就 会 受 损 。 该 系统 把 这 个 数字 存储 为 6 154 302 345.00。 整 数 部 分 比 实际 小 了 很 多 。 


一 背 有 委 大 的 由 部 分 直人 小 的 小 数 部 分 的 实 路 丰 应 该 用 定点 表示 法 在 入 
1. 浮 扩 表 示 法 
用 于 维持 正确 度 或 精度 的 解决 方法 是 使 用 浮 点 表示 法 。 该 表示 法 允许 小 数 点 浮动 : 我 们 可 
以 在 小 数 点 的 左右 有 不 同 数量 的 数码 。 使 用 这 种 方法 极 大 地 增加 了 可 存储 的 实数 范围 ， 带 有 很 
大 的 整数 部 分 或 很 小 的 小 数 部 分 的 实数 可 以 存储 一 i 
在 内 存 中 了 。 在 浮 点 表示 法 中 ， 无论 十 进 制 还 是 
二 进 制 ， 一 个 数字 都 由 3 部 分 组 成 ， 如 图 3-10 
所 示 。 





浮 点 数 表 示 法 
图 3-10 在 浮 点 表示 法 中 一 个 实数 的 三 个 部 分 


第 一 部 分 是 符号 ， 可 正 可 负 。 第 二 部 分 显示 小 数 点 应 该 左右 移动 构成 实际 数字 的 位 移 


量 。 第 三 部 分 是 小 数 点 位 置 固定 的 定点 表示 法 。 


oe 


二 个 数字 的 浮 点 表示 法 由 3 部 分 组 成 : 符号 、 位 移 量 和 定点 数 。 
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浮 点 表示 法 在 科学 中 用 于 表示 很 小 或 很 大 的 十 进 制 数 。 在 称 作 科学 计数 法 的 表示 法 中 ， 
定点 部 分 在 小 数 点 左边 只 有 1 个 数码 而 且 位 移 量 是 10 的 寡 次 。 
列 下 面 演示 用 科学 计数 法 ( 浮 点 表示 法 ) 表示 十 进 制 数 7 425 000 000 000 000 





000 000.00。 


解 
实际 数字 一 + 7425 000 000 000 000 000 000. 90 


科学 计数 法 一 + 7.425 x 10% 2 pe en SE 

这 三 部 分 为 符号 (+)、 位 移 量 (21 ) 以 及 定点 者 协 ， (7.425 )。 注 意 那个 位 移 量 就 是 指 
数 。 这 种 表示 法 的 好 处 显而易见 。 即 使 是 在 一 张 纸 上 写 数 字 ， 科 学 计数 法 也 更 短 并 更 省 空 
间 。 这 种 计数 法 使 用 了 浮 点 表示 法 的 概念 ， 因 为 那个 靠近 例题 右 下 方 的 小 数 点 位 置 已 经 向 左 
移 了 21 位 形成 该 数字 的 定点 部 分 。 一 些 程序 设计 语言 和 计算 器 按照 +7.425E21 来 显示 该 数 
字 ， 因 为 以 10 为 底 是 不 言 而 喻 的 。 
例 用 科学 计数 法 表示 数字 -0.000 000 000 000 023 2。 

解 ”使 用 前 例 同 样 的 方法 ， 将 小 数 点 移 到 数码 2 之 后 ， 如 下 所 示 : 

实际 数字 一 - nD Re 

科学 计数 法 一 -= 232X10M 

注意 这 里 指数 是 负 的 ， 因为 小 数 点 需要 左 移 (14 位 ) 来 构成 原 数字 。 我 们 可 再 次 说 该 
计数 法 中 的 数字 由 3 部 分 组 成 : 符号 (-)、 实 数 ( 2.32 ) 以 及 负 整 数 ( -14 )。 一 些 程 序 设计 
语言 和 计算 器 按照 -2.32E-14 来 显示 该 数字 。 

类 似 方法 可 用 于 表示 很 小 或 很 大 的 存储 于 计算 机 中 的 二 进 制 数字 (整数 和 实数 缘 可 )。 

用 浮 点 格式 表示 数字 (101001000000000000000000000000000.00);。 

解 ”使 用 前 例 同样 的 方法 ， 小 数 点 前 只 保留 一 位 数字 ， 如 下 所 示 ; 

实际 数字 一 + (101001000000000000000000000000000. pe- 

科学 计数 法 一 + 针 0L002 2 

注意 我 们 不 必 担 心 从 最 右边 的 1 开始 的 右 侧 的 那些 0 a 
(1.01001); 时 它们 并 不 重要 。 指 数 显示 为 32， 但 它 实际 上 以 二 进 制 存储 在 计算 机 中 ， 正 如 不 
入 我 们 要 看 到 的 那样 。 我 们 也 已 经 显示 符号 为 正 ， 但 它 可 能 作为 1 位 存储 。 
用 浮 点 格式 表示 数字 -(0.00000000000000000000000101):。 
解 使 用 前 例 同样 的 方法 小 数 点 左边 只 留 一 个 非 零 数码 : 
实际 数字 (oroo000 A die 











注意 ， ee 

2. 规范 化 

为 了 使 表示 法 的 固定 部 分 统一 ， 科 学 计数 法 (用 于 十 进 制 ) 和 浮 点 表示 法 (用 于 二 进 制 ) 
都 在 小 数 点 左边 使 用 了 唯一 的 非 零 数码 ， 这 称 为 规范 化 。 十 进 制 系统 中 的 数码 可 能 是 1 一 9， 
而 二 进 制 系统 中 该 数码 是 0 或 1。 在 下 面 ，d 是 非 零 数码 ，x 是 一 个 数码 , y 是 0 或 1。 

十 进 制 一 土 Se 注意 : d 是 1 一 9， 每 个 zx 是 0 一 9 

二 进 制 一 土 yyyW9py》 注意 : 每 个 ?是 0 或 1 
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3. 符号 、 指 数 和 尾数 
在 二 进 制 数 规范 化 之 后 ， 我 们 只 存储 了 一 个 数 的 三 部 分 信息 : 符号 、 指 数 和 尾数 (小 数 
点 右边 的 位 )。 例 如 ，+1000111.0101 规范 化 后 变 成 为 : 


符号 指数 尾数 
十 2 x 1.0001110101 
1 67 -O000111010 入 


注意 小 数 点 和 定点 部 分 左边 的 位 1 并 没有 存储 ， 它 们 是 隐 含 的 。 


符号 

一 个 数 的 符号 可 以 用 一 个 二 进 制 位 来 存储 (0 或 1 )。 

指数 

指数 (2 的 寡 ) 定义 为 小 数 点 移动 的 位 数 。 注 意 震 可 以 为 正 也 可 以 为 负 。 余 码 表示 法 
(后 面 讨论 ) 是 用 来 存储 指数 位 的 方法 。 


尾数 
尾数 是 指 小 数 点 右边 的 二 进 制 数 。 它 定义 了 该 数 的 精度 。 尾 数 是 作为 无 符号 整数 存储 


的 。 如 果 我 们 把 尾数 和 符号 一 起 考虑 ， 则 可 以 说 这 个 组 合 是 作为 符号 加 绝对 值 格式 的 整数 存 
储 的 。 但 是 ， 我 们 需要 记 住 它 不 是 整数 ， 而 是 像 整数 那样 存储 的 小 数 部 分 。 我 们 强调 这 一 点 
是 因为 在 尾数 中 ， 如 果 在 数字 的 右边 插 和 人 多余 的 零 ， 这 个 值 将 会 改变 ， 而 在 一 个 真正 的 整数 
中 ， 如 果 在 数字 的 左边 插入 多 余 的 零 ， 这 个 值 是 不 会 改变 的 。 

_ 属 数 是 带 符号 的 小 数 部 分 ， 可 以 像 以 符号 加 绝对 值 表示 法 存储 的 整数 那样 对 待 ” 

4. 余 码 系统 

尾数 可 以 作为 无 符号 数 存储 。 指 数 ( 即 显 示 小 数 点 应 该 左 移 或 右 移 多 少 位 的 寡 次 ) 是 有 
符号 的 数 。 尽 管 这 可 以 用 二 进 制 补 码 表示 法 来 存储 ， 但 被 一 种 称 为 余 码 系统 的 新 的 表示 法 取 
而 代 之 。 在 该 余 码 系统 中 ， 正 的 和 负 的 整数 都 可 以 作为 无 符号 数 存储 。 为 了 表示 正 的 或 负 的 
整数 ， 一 个 正 整数 ( 称 为 一 个 偏 移 量 ) 加 到 每 个 数字 中 ， 将 它们 统一 移 到 非 负 的 一 边 。 这 个 
偏 移 量 的 值 是 2"-!- 1，m 是 内 存单 元 存储 指数 的 大 小 。 

人 区 我 们 可 以 用 4 位 存储 单元 在 数字 系统 中 表示 16 个 整数 。 使 用 一 个 单元 作为 
0， 其 他 15 个 (不 等 地 ) 可 以 在 -7 ~ 8 的 范围 中 表示 整数 ， 如 图 3-11 所 示 。 在 该 范围 中 增 
加 7 个 单位 到 每 个 整数 中 ， 可 以 统一 把 所 有 整数 向 右 移 ， 使 其 均 为 整数 而 无 须 改 变 这 些 整数 
的 相对 位 置 ， 避 免 了 相互 调整 ， 如 图 3-11 所 示 。 新 系统 称 为 余 7， 或 者 偏 移 量 为 7 的 偏 移 表 
二 法。 
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图 3-11 余 码 表示 法 中 的 移 位 
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这 种 新 的 表示 法 与 移 位 前 的 表示 法 相 比 ， 其 优点 在 于 在 余 码 系统 中 的 所 有 整数 都 是 正 
” 数 ， 当 我 们 对 这 些 整数 进行 比较 或 运算 时 不 需要 考虑 符号 。 对 于 4 位 存储 单元 ， 如 我 们 希望 
的 那样 ， 偏 移 量 是 2”- 1=7。 


s. IEEE 标准 
电气 和 电子 工程 师 协会 (IEEE) 已 定义 了 几 种 存储 浮 点 数 的 标准 。 这 里 我 们 讨论 其 中 两 


种 最 常用 的 一 一 单 精 度 和 双 精 度 。 该 格式 如 图 3-12 所 示 。 方 框 上 方 的 数 就 是 每 一 项 的 位 数 。 


~ F Ep Be 玫 ”# ee A 到 
be re Ws - Py 
余 127 码 a 
Ne 
Tad ds a -} 站 ; 








b) 双 精 度 ( 64 位 ) 
图 3-12 浮 点 数 表示 法 的 IEEE 标准 


单 精 度数 格式 采用 总 共 32 位 来 存储 一 个 浮 点 表示 法 的 实数 。 符 号 占用 1 位 (0 为 正 ，! 为 
负 )， 指 数 占用 8 位 〈 使 用 偏 移 量 127 )， 尾 数 使 用 23 位 (无 符号 数 )。 该 标准 有 时 称 为 余 127 


码 (Excess 127 )， 因 为 偶 移 量 是 127。 
双 精 度数 格式 采用 总 共 64 位 来 表 3-2 两 种 IEEE 浮 点 标准 的 规格 说 明 
Cr TT 


存储 一 个 浮 点 表示 法 的 实数 。 符 号 
占用 1 位 (0 为 正 ，! 为 负 )， 指 数 占 存储 器 单元 大 小 (位 的 个 数 ) 64 
用 11 位 (使 用 偏 移 量 1023 )， 尾 数 使 《符号 位 大 小 (位 的 人 数 ) | 1 | 1 
用 52 位 。 该 标准 有 时 称 为 余 1023 码 指数 的 大 小 (位 的 仇 ) | 8 | 
(Excess_1023 )， 因 为 偏 移 量 是 1023。 ”尾数 的 大 小 (位 的 个 数 ) 52 
表 3-2 总 结 了 这 两 种 标准 的 规格 。 偏 移 量 ( 整数 ) 127 1023 

6. IEEE 标准 浮 点 数 的 存储 

参照 图 3-12， 使 用 以 下 步骤 ， 一 个 实数 可 以 存储 为 IEEE 标准 浮 点 数 格式 : 

。 在 S 中 存储 符号 (0 或 1 )。 

。 将 数字 转换 为 二 进 制 。 

。 规范 化 。 

。 找到 EE 和 M 的 值 。 

。 连接 S、E 和 M。 

写 出 十 进 制 数 5.75 的 余 127 码 ( 单 精度 ) 表示 法 。 

解 

a. 符号 为 正 ， 所 以 S= 0。 

b. 十 进 制 转换 为 二 进 制 : 5.75 = (101.11):。 

c. 规范 化 : (101.11): = (1.0111)2X 2?。 

d. E=2+127= 129 = (10000001),，M = 0111。 我 们 需要 在 M 的 右边 增加 19 个 0 使 之 
成 为 23 位 。 

e, 该 表示 法 如 下 所 示 : 
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S E M 

0 .10000001 "01110000000000000000000 
存储 在 计算 机 中 的 数字 是 01000000101110000000000000000000。 
ez 写 出 十 进 制 数 -161.875 的 余 127 码 ( 单 精度 ) 表示 法 。 





解 


a, 符号 为 负 ， 所 以 S= 1。 
b. 十 进 制 转换 为 二 进 制 ， 161.875 = (10100001.111);。 
c. 规范 化 : (10100001.111) = (1.0100001111):X 2?。 
d.E=7+127=134=(10000110),， 而 M = (0100001111);。 
e. 该 表示 法 如 下 所 示 : 
S 3 M : 
1 10000110 01000011110000000000000 
存储 在 计算 机 中 的 数字 是 11000011010000111100000000000000。 
写 出 十 进 制 数 -0.023 437 5 的 余 127 码 ( 单 精度 ) 表示 法 。 


解 

a. S = 1 (该 数 为 负 )。 

b. 十 进 制 转换 为 二 进 制 : 0.023 437 5= (0.0000011):。 

c, 规范 化 : (0.0000011): = (1.1):X2-。 

d. E=-6+127=121=(01111001),, M= (1):。 

e. 该 表示 法 如 下 所 示 : 
Se z :eg 
1 01111001 “10000000000000000000000; 

存储 在 计算 机 中 的 数字 是 10111100110000000000000000000000。 

7. 将 存储 为 [EEE 标准 浮 点 数 的 数字 还 原 

一 个 以 IEEE 浮 点 格式 之 一 存储 的 数字 可 以 用 以 下 步骤 还 原 : 

。 找到 S、E 和 M 的 值 。 

。 如果 S =0， 将 符号 设 为 正 号 ， 否 则 设 为 负 号 。 

。 找到 位 移 量 (E-127 )。 

。 对 尾数 去 规范 化 。 

。 将 去 规范 化 的 数字 变 为 二 进 制 以 求 出 绝对 值 。 

。 加 上 符号 。 

位 模式 (11001010000000000111000100001111); 以 余 127 码 格式 存储 于 内 存 


中 ， 求 该 数字 十 进 制 计数 法 的 值 。 






解 
a, 首位 表示 S$, 后 8 位 是 E， 剩 下 23 位 是 M。 

S 三 M 

1 10010100 N00000001 700001111 
b. 符号 为 负 号 。 


c. 位 移 量 =E-127=148-- 127 = 21。 


d. 去 规范 化 得 到 (1.00000000111000100001111),X2”。 

e. 二 进 制 数 是 (1000000001110001000011.11):。 

f 绝对 值 是 2 104 378.75。 

g. 该 数字 是 -2 104 378.75。 

位 模式 01000011111000000000000000000000) 以 余 127 码 格 式 存储 于 内 存 


中 ， 求 该 数字 十 进 制 计数 法 的 值 。 





解 
a. 首位 表示 S, 后 8 位 是 E， 剩 下 23 位 是 M。 

S E M 

0 10000111 “11000000000000000000000 - 
b. 符号 为 正 号 。 


c. 位 移 量 =E- 127=135 - 127= 8。 

d. 去 规范 化 得 到 (1.11000000000000000000000 ),X2°。 
e. 二 进 制 数 是 (111000000.00)>。 

f. 绝对 值 是 448。 

g. 该 数字 是 +448。 


8. 上 溢 和 下 滋 
对 于 浮 点 数 ， 有 上 滋 和 下 滋 两 种 情况 。 图 3-13 显示 了 使 用 32 位 内 存单 元 ( 余 127 码 ) 


的 浮 点 表示 法 范围 。 该 表示 法 不 能 存储 很 小 或 很 大 的 绝对 值 。 试 图 存储 绝对 值 很 小 的 数 会 
导致 下 溢 ， 而 试图 存储 绝对 值 很 大 的 数 会 导致 上 滋 。 我 们 把 临界 值 (+ 最 大 值 ，- 最 大 值 ， 
+ 最 小 值 ，- 最 小 值 ) 的 计算 留 作 练习 。 


-最 大 值 : 一 (1 -223) x 2+28 + 最 大 值 : 一 (1 一 2-2) x 2+128 
-最 小 值 : (1 一 27) x 2-2 + 最 小 值 : (1 -2-0 x 2-27 


“下 洲 | 可 表示 (负数 ) 可 表示 ( 正 数 ) [六 正当 让 





-最 大 值 -最 小 值 0+ 最 小 值 + 最 大 值 
图 3-13 ”实数 的 浮 点 表示 法 中 的 上 滋 和 下 洲 


9. 存储 零 
你 可 能 注意 到 带 有 整数 部 分 和 小 数 部 分 的 实数 设置 为 零 的 时 候 是 0.0， 无 法 用 以 上 讨论 
的 步骤 存储 。 为 了 处 理 这 个 特例 ， 约 定 在 这 种 情况 下 符号 、 指 数 和 尾数 都 设 为 零 。 
10. 截断 错误 
当 使 用 浮 点 表示 法 存储 实数 时 ， 存 储 数字 的 值 可 能 不 是 我 们 希望 的 。 例 如 ， 假 定 我 们 需 
要 在 内 存 中 用 余 127 码 表示 法 存储 这 个 数字 
1111411114411414.11111111111)2 
规范 化 之 后 得 到 
-011114111111T111111111111111)2 
这 意味 着 尾数 有 2 Ll。 人 23 个 1, 换言之 ， 存 储 在 计算 机 中 的 是 : 
TT) 


原来 的 数 变 为 
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(1111111111111111.11111111)z 
小 数 部 分 右边 的 3 个 1 被 截 掉 了 。 这 种 原始 数字 与 还 原 后 数字 的 差异 称 为 截断 错误 。 在 
使 用 很 小 或 很 大 数字 的 地 方 ， 如 宇航 业 的 计算 中 ， 这 种 类 型 的 错误 是 很 严重 的 。 这 种 情况 下 ， 
我 们 需要 更 大 的 内 存单 元 和 其 他 的 表示 法 。 为 此 ，IEEE 定义 了 用 于 更 大 尾数 的 其 他 表示 法 。 


3.3 ”存储 文本 

在 任何 语言 中 ， 文 本 的 片段 是 用 来 表示 该 语言 中 某 个 意思 的 一 系列 的 符号 。 例 如 ， 在 英 
语 中 使 用 26 个 符号 (A, B, C, …, Z) 来 表示 大 写字 母 ，26 个 符号 (a, b, c, …, z) 表示 小 写字 
母 ，10 个 符号 (0, 1, 2,…, 9 ) 来 表示 数字 字符 (不 是 实际 的 数字 ， 后 面 将 看 到 它们 的 不 同 
之 处 )， 以 及 符号 (.，?，:，; ，…，! ) 来 表示 标点 。 另 外 一 些 符 号 (如 空格 、 换 行 和 制 表 符 ) 
被 用 于 文本 的 对 齐 和 可 读 性 。 

我 们 可 用 位 模式 来 表示 任何 一 个 符号 。 换 句 话说 ， 如 4 个 符号 组 成 的 文本 “CATS” 能 
用 4 个 nn 位 模式 表示 ， 任 何 一 个 模式 定义 一 个 单 
独 的 符号 (图 3-14 )。 栈 避 

现在 的 问题 是 : 在 一 种 语言 中 ， 位 模式 到 底 IT PE D1 
需要 多 少 位 来 表示 一 个 符号 ? 这 主要 取决 于 该 语 图 3-14 “使 用 位 模式 表示 符号 
言 集中 到 底 有 多 少 不 同 的 符号 。 例 如 ， 如 果 要 创 
建 的 某 个 虚构 的 语言 仅仅 使 用 大 写 英文 字母 ， 则 只 需要 26 个 符号 。 相 应 地 ， 这 种 语言 的 位 
模式 至 少 需要 表示 26 个 符号 。 

对 另 一 种 语言 ， 如 中 文 ， 可 能 需要 更 多 的 符号 。 在 一 种 语言 中 ， 表 示 某 一 符号 的 位 模式 
的 长 度 取决 于 该 语言 中 所 使 用 的 符号 的 数量 。 更 多 的 符号 意味 着 更 长 的 位 模式 。 

尽管 位 模式 的 长 度 取决 于 符号 的 数量 ， 但 是 它们 的 关系 并 不 是 线性 的 ， 而 是 对 数 的 。 
如 果 需 要 2 个 符号 ， 位 模式 长 度 将 是 1 位 (log:2 = 1 ) ; 如 果 需 要 4 个 符号 ， 长度 将 是 2 位 
(logz4 = 2 )。 从 表 3-3 中 可 以 很 容易 看 出 它们 之 间 的 关系 。2 位 的 位 模式 能 表示 4 种 不 同 的 
形式 : 00，01，10 和 11。 这 些 形式 中 的 任何 一 种 都 可 用 来 代表 一 个 字符 。 同 样 ，3 位 的 位 
模式 有 8 种 不 同 的 形式 : 000，001，010，011，100，101，110 和 111。 


表 3-3 符号 数量 和 位 模式 长 度 的 关系 
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3.3.1 代码 


不 同 的 位 模式 集合 被 设计 用 于 表示 文本 符号 。 其 中 每 一 个 集合 我 们 称 之 为 代码 。 表 示 符 
号 的 过 程 被 称 为 编码 。 本 小 节 将 介绍 常用 代码 。 

1. ASCII 

美国 国家 标准 协会 (ANSI) 开发 了 一 个 被 称 为 美国 信息 交换 标准 码 (ASCII) 的 代码 。 
该 代码 使 用 7 位 表示 每 个 符号 ， 即 该 代码 可 以 定义 2'= 128 种 不 同 的 符号 。 用 于 表示 ASCII 
码 的 完整 位 模式 可 见 附录 A。 如 今 ASCII 是 Unicode 的 一 部 分 ， 下 面 将 要 讨论 。 
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2. Unicode 

硬件 和 软件 制造 商 联合 起 来 共同 设计 了 一 种 名 为 Unicode 的 代码 ， 这 种 代码 使 用 32 位 
并 能 表示 最 大 达 22 = 4 294 967 296 个 符号 。 代 码 的 不 同 部 分 被 分 配 用 于 表示 来 目 世 界 上 不 
同 语言 的 符号 。 其 中 还 有 些 部 分 被 用 于 表示 图 形 和 特殊 符号 。Unicode 符号 的 集 见 附录 A。 
如 今 ASCII 是 Unicode 的 一 部 分 。 


3.4 存储 音频 

音频 表示 声音 或 音乐 。 音 频 与 我 们 讨论 到 现在 的 数字 和 文本 有 本 质 上 的 不 同 。 文 本 由 可 
数 的 实体 (文字 ) 组 成 : 我 们 可 以 数 出 文本 中 文字 的 数量 。 文 本 是 数字 数据 的 一 个 例子 。 相 
反 ， 音 频 是 不 可 数 的 。 音 频 是 随时 间 变 化 的 实体 ， 我 们 只 能 在 每 一 时 刻度 量 声音 的 密度 。 当 
我 们 讨论 用 计算 机 内 存 存 储 声 音 时 ， 我 们 的 意思 是 存储 一 个 音频 信号 的 密度 ， 例 如 每 隔 一 段 
时 间 (一 秒 钟 、 一 小 时 ) 来 自 麦 克 风 的 信和 号 。 

音频 是 模拟 数据 的 例子 。 即 使 我 们 能 够 在 一 段 时 间 度 量 所 有 的 值 ， 也 不 能 把 它们 全 部 存 
储 在 计算 机 内 存 中 ， 因 为 可 能 需要 无 限 数量 的 内 存单 元 。 图 3-15 显示 了 一 个 模拟 信号 随时 
间 变 化 的 本 质 ， 如 音频 。 


时 间 ( 横 轴 ) 





在 一 秒 中 有 无 穷 多 个 值 
图 3-15 一 个 音频 信号 


3.4.1 采样 


如 果 不 能 记录 一 段 间隔 的 音频 信号 的 所 有 值 ， 至 少 我 们 可 以 记录 其 中 的 一 些 。 采 样 意味 
着 我 们 在 模拟 信号 上 选择 数量 有 限 的 点 来 度量 它们 的 值 并 记录 下 来 。 图 3-16 显示 了 从 这 样 
的 信号 上 选择 10 个 样本 : 我 们 可 以 记录 这 些 值 来 表现 模拟 信号 。 


时 间 ( 横 轴 ) 





et 
图 3-16 一 个 音频 信号 的 采样 


采样 率 
接 下 来 的 逻辑 问题 是 ， 我 们 每 秒 钟 需要 多 少 样本 才能 还 原 出 原始 信号 的 副本 ?样本 数量 


依赖 于 模拟 信号 中 变化 的 最 大 数量 。 如 果 信 号 是 平滑 的 ， 则 需要 很 少 的 样本 ; 如 果 信 号 变化 
剧烈 ， 则 需要 更 多 的 样本 。 每 秒 40 000 个 样本 的 采样 率 对 重 现 音频 信和 号 来 说 足够 好 了 。 


3.4.2 量化 
从 每 个 样本 测量 来 的 值 是 真实 的 数字 。 这 意味 着 我 们 可 能 要 为 每 一 秒 的 样本 存储 
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40 000 个 真实 的 值 。 但 是 ， 为 每 个 样本 使 用 一 个 无 符号 的 数 (位 模式 ) 会 更 简便。 量化 指 的 
是 将 样本 的 值 截取 为 最 接近 的 整数 值 的 一 种 过 程 。 例 如 ， 如 果实 际 的 值 为 17.2， 就 可 截取 为 
17; 如 果 值 为 17.7， 就 可 截取 为 18。 


3.4.3 编码 


接 下 来 的 任务 是 编码 。 量 化 的 样本 值 需 要 被 编码 成 位 模式 。 一 些 系统 为 样本 赋 正 值 或 负 
值 ， 另 一 些 仅仅 移动 曲线 到 正 的 区 间 从 而 只 赋 正 值 。 换 言 之 ， 一 些 系统 使 用 无 符号 整数 来 表 
示 样 本 ， 而 另 一 些 使 用 有 符号 的 整数 来 做 。 但 是 ， 有 符号 的 整数 不 必用 在 二 进 制 补 码 中 ， 它 
们 可 以 是 符号 加 绝对 值 的 值 。 最 左边 的 位 用 于 表示 符号 (0 表示 正 值 ，1 表示 负 值 )， 其 余 的 
位 用 于 表示 绝对 值 。 

1. 每 样本 位 

对 于 每 个 样本 系统 需要 决定 分 配 多 少 位 。 尽 管 在 过 去 仅 有 8 位 分 配给 声音 样本 ， 现 在 每 
样本 16、24 甚至 32 位 都 是 正常 的 。 每 样本 位 的 数量 有 时 称 为 位 深度 。 

2. 位 率 

如 果 我 们 称 位 深度 或 每 样本 位 的 数量 为 B， 每 秒 样本 数 为 S， 我 们 需要 为 每 秒 的 音频 存 
储 SXB 位 。 该 乘积 有 时 称 为 位 率 了 R。 例 如 ， 如 果 我 们 使 用 每 秒 40 000 个 样本 以 及 每 样本 
16 位， 位 率 是 R = 40 000X16= 640 000 b/s = 640 KB/s。 


3.4.4 声音 编码 标准 


”当今 音频 编码 的 主流 标准 是 MP3 (MPEG Layer 3 的 简写 )。 该 标准 是 用 于 视频 压缩 方 
法 的 MPEG (动态 图 像 专家 组 ) 标准 的 一 个 修改 版 。 它 采用 每 秒 44 100 个 样本 以 及 每 样本 
16 位 。 结 果 信号 达到 705 600 b/s 的 位 率 ， 再 用 去 掉 那 些 人 耳 无 法 识别 的 信息 的 压缩 方法 进 
行 压缩 。 这 是 一 种 有 损 压 缩 法 ， 与 无 损 压 缩 法 相反 ， 参 见 第 15 章 。 


3.5 “存储 图 像 
存储 在 计算 机 中 的 图 像 使 用 两 种 不 同 的 技术 : 光栅 图 或 矢量 图 。 


3.5.1 光栅 图 


” 当 我 们 需要 存储 模拟 图 像 (如 照片 ) 时 ， 就 会 用 到 光栅 图 (或 位 图 )。 一 张 照片 由 模拟 数 
据 组 成 ， 类 似 于 音频 信息 。 不 同 的 是 数据 密度 (色彩 ) 随 空间 变化 ， 而 不 是 随时 间 变 化 。 这 
意味 着 数据 需要 采样 。 然 而 ， 这 种 情况 下 采样 通常 被 称 作 扫描 。 样 本 称 为 像素 (代表 图 像 元 
素 )。 换 言 之 ， 整 个 图 像 被 分 成 小 的 像素 ， 每 个 像素 假定 有 单独 的 密度 值 。 

1. 解析 度 

就 像 音 频 采 样 那样 ， 在 图 像 扫 描 中 ， 我 们 要 决定 对 于 每 英寸 的 方块 或 线条 需要 记录 多 少 
像素 。 在 图 像 处 理 中 的 扫描 率 称 为 解析 度 。 如 果 解 析 率 足够 高 ， 人 有 眼 不 会 看 出 在 重 现 图 像 中 
的 不 连续 。 

2. 色彩 深度 

用 于 表现 像素 的 位 的 数量 ， 即 色彩 深度 ， 依 赖 于 像素 的 颜色 是 如 何 由 不 同 的 编码 技术 来 
处 理 的 。 对 颜色 的 感知 依赖 于 我 们 的 眼睛 如 何 对 光线 进行 响应 。 我 们 的 眼睛 有 不 同类 型 的 感 
光 细 胞 : 一 些 响应 红 、 绿 、 蓝 三 原色 (也 叫 RGB)， 而 另 一 些 仅仅 响应 光 的 密度 。 
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真 彩色 

用 于 像素 编码 的 技术 之 一 称 为 真 彩色 ， 它 使 用 24 位 来 编码 一 个 像素 。 在 该 技术 中 ， 每 个 
三 原色 (RGB) 都 表示 为 8 位 。 因 为 该 技术 中 8 位 模式 可 以 表示 0 一 255 之 间 的 一 个 数 ， 所 以 
每 种 色彩 都 由 0 一 255 之 间 的 三 维 数字 表示 。 表 3-4 显示 了 该 技术 中 用 于 一 些 颜 色 的 3 个 值 。 


表 3-4 ”定义 为 真 彩色 的 一 些 颜 色 


se | oo | | wl wm |o | 


注意 ， 真 彩色 模式 可 以 编码 2” 或 16 777 216 种 颜色 。 换 言 之 ,各 个 像素 的 色彩 深度 是 


这 些 值 的 其 中 之 一 。 

索引 色 

真 彩色 模式 使 用 了 超过 1600 万 种 颜色 。 许 多 应 用 程序 不 需要 如 此 大 的 颜色 范围 。 索 引 
色 (或 调 色 板 色 ) 模式 仅 使 用 其 中 的 一 部 分 。 在 该 模式 中 ， 每 个 应 用 程序 从 大 的 色彩 集中 选择 
一 些 颜 色 (通常 是 256 种 ) 并 对 其 建立 索引 。 对 选中 
的 颜色 赋 一 个 0 一 255 之 间 的 值 。 这 就 类 似 于 艺术 家 
可 能 在 他 们 的 画室 用 到 很 多 种 颜色 ， 但 每 一 次 仅 用 到 
调 色 板 中 的 一 些 颜 色 。 图 3-17 示意 了 索引 色 的 思路 。 

对 索引 的 使 用 减少 了 需要 存储 一 个 像素 所 需要 
的 位 的 数量 。 例 如 ， 真 彩 模式 需要 24 位 来 储存 一 个 
像素 ， 索 引 色 模式 通常 使 用 256 个 索引 ， 这 需要 8 图 3.17 索引 色 模 式 到 真 彩色 模式 的 关系 


位 来 存储 同样 的 像素 。 例 如 ， 一 部 高 质量 的 数码 相机 
要 用 几乎 300 万 像素 拍摄 一 张 3X5 英寸 的 相片 。 以 下 显示 使 用 各 种 模式 存储 所 需要 的 位 


Si 16 777 216 





的 数量 。 
真 彩色 : 3000000 x 24 = 72000000 
索引 色 : 3000000 x 8 = 24000000 
3. 图 像 编 码 标准 


几 种 用 于 图 像 编 码 的 实际 标准 正在 使 用 中 。JPEG (联合 图 像 专家 组 ) 使 用 真 彩色 模式 ， 
但 压缩 图 像 来 减少 位 的 数量 (参见 第 15 章 )。 另 一 方面 ,GIF( 图 形 交换 格式 ) 使 用 索引 色 模式 。 


3.5.2 矢量 图 

光栅 图 有 两 个 缺点 ， 即 文件 体积 太 大 和 重新 调整 图 像 大 小 有 麻烦 。 放 大 光栅 图 像 意味 着 
扩大 像素 ， 所 以 放大 后 的 图 像 看 上 去 很 粗糙 。 但 是 ， 矢 量 图 图 像 编 码 方法 并 不 存储 每 个 像素 
的 位 模式 。 一 个 图 像 被 分 解 成 几何 图 形 的 组 合 ， 例 如 ， 线 段 、 和 矩形 或 图形。 每 个 几何 形状 直 
数学 公式 表达 。 例 如 ， 线 段 可 以 由 它 端点 的 坐标 描述 ， 圆 可 以 由 它 的 圆心 坐标 和 半径 长 度 来 
描述 。 矢 量 图 是 由 定义 如 何 绘制 这 些 形状 的 一 系列 命令 构成 的 。 


日 1 英寸 约 等 于 0.0254 米 。 一 一 编辑 注 
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当 要 显示 或 打印 图 像 时 ， 将 图 像 的 尺寸 作为 输入 传 给 系统 。 系 统 重新 设计 图 像 的 大 小 并 
用 相同 的 公式 画 出 图 像 。 在 这 种 情况 下 ， 每 绘制 一 次 图 像 ， 公 式 将 重新 估算 一 次 。 因 此 ， 矢 
量 图 也 称 为 几何 模型 或 面向 对 象 图 形 。 

例如 ， 考 虑 半径 为 r 的 圆 形 。 程 序 绘制 该 圆 需 要 的 主要 信息 如 下 : 

1 ) 一 个 圆 的 半径 r。 

2) 圆心 的 位 置 。 

3 ) 绘制 的 线 型 和 颜色 。 

4 ) 填充 的 类 型 和 颜色 。 

当 该 圆 的 大 小 改变 时 ， 程 序 改变 半径 的 值 并 重新 计算 这 些 信息 以 便 再 绘制 一 个 圆 。 改 变 
图 像 大 小 不 会 改变 绘图 的 质量 。 

矢量 图 不 适合 存储 照片 图 像 的 细微 精妙 。JPEG 或 GIF 光栅 图 提供 了 更 好 和 更 生动 的 图 
片 。 矢 量 图 适合 应 用 程序 采用 主要 的 几何 元 素来 创建 图 像 。 它 用 于 诸如 Flash 这 样 的 应 用 程 
序 ， 以 及 创建 TrueType (微软 、 苹 果 公 司 ) 和 PostScript (Adobe 公司 ) 字体 。 计 算 机 辅助 设 


计 (CAD) 也 使 用 矢量 图 进行 工程 绘图 。 


3.6 ”存储 视频 

视频 是 图 像 ( 称 为 帧 ) 在 时 间 上 的 表示 。 一 部 电影 就 是 一 系列 的 帧 一 张 接 一 张 地 播放 而 
形成 运动 的 图 像 。 换 言 之 ,视频 是 随 空间 (单个 图 像 ) 和 时 间 (一 系列 图 像 ) 变化 的 信息 表 
现 。 所以， 如 果 知道 如 何 将 一 幅 图 像 存 储 在 计算 机 中 ， 我 们 也 就 知道 如 何 储存 视频 ， 每 一 幅 
图 像 或 帧 转化 成 一 系列 位 模式 并 储存 。 这 些 图 像 组 合 起 来 就 可 表示 视频 。 需 要 注意 现在 视频 
通常 是 被 压缩 存储 的 。 在 第 15 章 中 ， 我 们 将 讨论 MPEG， 这 是 一 种 常见 的 视频 压缩 技术 。 


3.7 ” 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
。 Halsall, F. Multimedia Communication, Boston, MA: Addison-Wesley, 2001 
® Koren, I. Computer Arithmetic Algorithms, Natick, MA: A K Peters, 2001 
。 Long, B. Complete Digital Photography, Hignham, MA: Charles River Media, 2003 
® Mano, M. Computer System Architecture, Upper Saddle River, NJ: Prentice-Hall, 1993 
s。 Miano, J. Compressed Image File Formats, Boston, MA: Addison-Wesley, 1999 


关键 术语 
American National Standards Institute (ANSI， bit (位 ) 
美国 国家 标准 协会 ) bit depth (位 深度 ) 


American Standard Code for Information bitmap graphic (位 映像 图 ) 
Interchange(ASCII， 美 国信 息 交 换 标准 码 ) ”bit pattern (位 模式 ) 

analog (模拟 ) bit rate (比特 率 ) 

audio (音频 ) byte( 字 节 ) 

binary digit (二 进 制 数字 ) code (编码 ) 
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color depth (颜色 深度 ) raster graphic (光栅 图 ) 
digital (数字 ) real (实数 ) 
Excess 1023 ( 余 1023 码 ) resolution (解析 度 ) 
Excess_127 ( 余 127 码 ) RGB 
Excess representation ( 余 码 表示 法 ) sampling (采样 ) 
floating-point representation ( 浮 点 数 表 示 ) sampling rate (采样 率 ) 
frames( 帧 ) scanning (扫描 ) 
Graphic Interchange Format ( GIF ， 图 形 交 换 scientific notation (科学 计数 法 ) 
格式 ) sign-and-magnitude representation (符号 加 绝 
indexed color (索引 色 ) 对 值 表示 法 ) 
Joint Photographer Experts Group (JPEG, 联 text (文本 ) 
合 图 像 专家 组 ) text editor (文本 编辑 器 ) 
mantissa (尾数 ) True-Color ( 真 彩色 ) 
MP3 truncation error (截断 错误 ) 


two's complement ( 补 码 ) 


MPEG 

normalization (规范 化 ) two’s complement representation ( 补 码 表示 法 ) 
one’s complement ( 反 码 ) underflow (下 滋 ) 

overflow (溢出 ) Unicode (统一 字符 编码 ) 

palette color ( 调 色 板 颜色 ) unsigned integer (无 符号 整数 ) 

picture element (图 片 元 素 ) vector graphic (矢量 图 ) 

pixel (像素 ) video (视频 ) 


quantization (量化 ) 


小 结 


数据 以 不 同 的 形式 出 现 ， 包 括 数 字 、 文 本 、 音 频 、 图 像 和 视频 。 所 有 的 数据 类 型 都 转 
换 为 称 为 位 模式 的 统一 表现 形式 。 

数字 在 存储 到 计算 机 内 存 中 之 前 被 转换 成 二 进 制 系统 。 有 数 种 方法 来 处 理 符号 。 有 两 
种 方法 来 处 理 小 数 点 : 定点 和 浮 点 。 整 数 可 以 被 当 作 小 数 点 位 置 固定 的 数字 : 小数 点 
固定 在 最 右边 一 位 。 无 符号 整数 是 永远 不 会 为 负 的 整数 。 存 储 有 符号 整数 的 方法 之 一 
是 符号 加 绝对 值 格式 。 在 这 种 格式 中 ， 最 左 位 用 于 显示 符号 且 其 余 位 定义 绝对 值 。 符 
号 和 绝对 值 互 相 分 开 。 几 乎 所 有 的 计算 机 都 使 用 二 进 制 补 码 表 示 法 来 存储 位 于 n 位 存 
储 单元 中 的 有 符号 整数 。 该 方法 中 ， 无 符号 整数 的 有 效 范围 被 分 为 两 个 相等 的 子 范 
围 。 第 一 个 子 范围 用 来 表示 非 负 整数 ， 第 二 个 子 范围 用 于 表示 负 整 数 。 在 二 进 制 补 码 
表示 法 中 ， 最 左 位 决定 整数 的 符号 ， 但 符号 和 绝对 值 互相 分 开 。 实 数 是 带 有 整数 部 分 
和 小 数 部 分 的 数字 。 实 数 使 用 浮 点 表示 法 存储 在 计算 机 中 。 一 个 数字 在 浮 点 表示 法 中 
由 三 部 分 组 成 : 符号 、 位 移 量 和 定点 数 。 

文本 的 片段 是 用 来 表示 该 语言 中 某 个 意思 的 一 系列 符号 。 我 们 可 用 位 模式 来 表示 每 一 
个 符号 。 不 同 的 位 模式 (代码) 集合 被 设计 用 于 表示 文本 符号 。 硬 件 和 软件 制造 商 联 
合 起 来 共同 设计 了 一 种 名 为 Unicode 的 代码 ， 这 种 代码 使 用 32 位 表示 一 个 符号 。 
音频 表示 声音 或 音乐 。 音 频 是 模拟 数据 。 我 们 不 能 够 在 一 段 时 间 记 录 无 限 数量 的 值 ， 
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我 们 只 能 记录 一 些 样本 。 样 本 数量 依赖 于 模拟 信号 中 变化 的 最 大 数量 。 从 每 个 样本 测 
量 来 的 值 是 真实 的 数字 。 量 化 指 的 是 将 样本 的 值 截取 为 最 接近 的 整数 值 的 一 种 过 程 。 

。 存储 在 计算 机 中 的 图 像 使 用 两 种 不 同 的 技术 : 光栅 图 或 矢量 图 。 当 需要 存储 模拟 图 像 
(如 照片 ) 时 ， 就 会 用 到 光栅 图 。 图 像 被 扫描 (采样 ) 然后 存储 像素 。 用 矢量 图 图 像 的 
方法 ， 一 个 图 像 被 分 解 成 几何 图 形 的 组 合 ， 例 如 ， 线 段 、 和 矩形 或 圆 形 。 每 个 几何 形状 
由 数学 公式 表达 。 

。 视频 是 图 像 ( 称 为 帧 ) 在 时 间 上 的 表示 。 一 部 电影 就 是 一 系列 的 帧 逐个 播放 而 形成 
运动 的 图 像 。 换 言 之 ， 视 频 是 随 空间 (单个 图 像 ) 和 时 间 (一 系列 图 像 ) 变化 的 信息 


表现 。 
3.8 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相 
关 测验 题 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q3-1 说 出 5 种 计算 机 可 以 处 理 的 数据 。 
Q3-2 ”位 模式 的 长 度 如 何 与 其 能 表示 的 符号 数量 相关 ? 
Q3-3 ”位 图 方法 是 如 何以 位 模式 来 表示 一 个 图 像 的 ? 
Q3-4 矢量 图 方法 优 于 位 图 方法 的 优点 是 什么 ?其 侧 点 又 是 什么 ? 
Q3-5 将 音频 数据 转换 为 位 模式 需要 哪些 步 又? 
Q3-6 ”比较 和 对 照 在 无 符号 、 符 号 加 绝对 值 以 及 二 进 制 补 码 格式 中 的 正 整数 的 表示 法 。 
Q3-7 ”比较 和 对 照 在 无 符号 、 符 号 加 绝对 值 以 及 二 进 制 补 码 格式 中 的 负 整 数 的 表示 法 。 
Q3-8 ”比较 和 对 照 在 符号 加 绝对 值 、 二 进 制 补 码 格式 和 余 码 格式 中 的 0 的 表示 法 。 
Q3-9 讨论 在 符号 加 绝对 值 和 二 进 制 补 码 格式 中 最 左 位 扮演 的 角色 。 
Q3-10 ”回答 以 下 关于 实数 浮 点 表示 法 的 问题 : 
a. 为 什么 需要 规范 化 ? 
b. 什么 是 尾数 ? 
c. 数字 在 规范 化 以 后 ， 何 种 信息 被 计算 机 存储 在 内 存 中 ? 


练习 题 

P3-1 我 们 可 以 有 多 少 不 同 的 5 位 模式 ? 

P3-2 一 些 国家 的 车 牌 有 两 个 十 进 制 数 码 (0~9 )， 我 们 可 以 有 多 少 种 不 同 的 车 牌 ? 如 果 不 允许 使 用 
数码 0， 又 会 有 多 少 种 不 同 的 车 牌 ? 

P3-3 用 2 个 数码 跟 3 个 大 写字 母 (A 一 Z) 的 车 牌 来 重 做 上 题 。 

P3-4 ”一 种 机 器 有 8 个 不 同 的 图 。 为 表示 每 个 圈 需 要 多 少 位 ? 

P3-5 学生 在 一 门 课程 中 的 成 绩 可 用 A、B、C、D、F、W (退学 ) 或 I (未 完成 ) 表示 等 级 。 表 示 这 
些 等 级 需要 多 少 位 ? 

P3-6 ”一 个 公司 决定 给 每 个 员工 分 配 唯一 的 位 模式 。 如 果 该 公司 有 900 名 雇员 ， 构 建 该 表示 法 的 系统 
最 少 需要 多 少 位 ? 可 分 配 多 少 位 模式 ? 如 果 再 雇佣 另外 300 名 员工 ， 系 统 需 要 增加 位 数 吗 ? 说 


明 答 案 。 
P3-7 如果 我 们 使 用 4 位 模式 表示 0 一 9 的 数码 ， 将 浪费 多 少 位 模式 ? 
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P3-8 


P3-9 


P3-10 


P3-11 


P3-12 


P3-13 


P3-14 


P3-15 


P3-16 


P3-17 


P3-18 


P3-19 


P3-20 


P3-21 


P3-22 


P3-23 


P3-24 


P3-25 


P3-26 


P3-27 


一 个 音频 信号 每 秒 钟 采样 8000 次 ， 每 个 样本 有 256 级 不 同 的 表示 。 表 示 这 个 信号 需要 每 秒 多 


少 位 ? 
将 下 列 十 进 制 数 转换 成 8 位 无 符号 整数 。 
a. 23 b. 121 c. 34 d. 342 
将 下 列 十 进 制 数 转换 成 16 位 无 符号 整数 。 
a, 41 b. 411] c. 1234 d. 342 
将 下 列 十 进 制 数 转换 成 8 位 二 进 制 补 码 表 示 法 。 
a. -12 b. -145 c. 56 d. 142 
将 下 列 十 进 制 数 转换 成 16 位 二 进 制 补 码 表示 法 。 
a. 102 b. -179 c. 534 d. 62 056 
将 下 列 8 位 无 符号 整数 转换 成 十 进 制 数 。 
a. 01101011 b. 10010100 c. 00000110 d. 01010000 
将 下 列 8 位 二 进 制 补 码 表示 的 整数 转换 成 十 进 制 数 。 
a. 01110111 b. 11111100 c. 01110100 d. 11001110 
下 面 是 一 些 二 进 制 补 码 表示 的 二 进 制 数 。 请 问 如 何 改 变 它们 的 正 负 。 
a. 01110111 b. 11111100 c. 01110111 d. 11001110 
如 果 在 一 个 数 上 应 用 二 进 制 补 码 表示 法 转换 两 次 ， 将 会 得 到 原 数 。 在 下 面 的 数 上 试 试看 。 
a. 01110111 b. 11111100 c. 01110100 d. 11001110 
将 下 面 的 二 进 制 浮 点 数 规范 化 。 在 规范 化 后 详细 指明 指数 的 值 是 多 少 。 
a. 1.10001 b. 23X111.1111 
c, 22X 101.110011 d, 25X101101.00000110011000 
将 下 面 的 数 转换 成 32 位 IEEE 格式 。 
a, -2°X 1.10001 b. +23X1.111111 c, +24X1.01110011 ”d. -235X1.01101000 
将 下 面 的 数 转换 成 64 位 IEEE 格式 。 
a. -20X 1.10001 b. +23X1.111111 c. +24X1.01110011 “dd. -25X1.01101000 
将 下 面 的 数 转换 成 32 位 的 IEEE 形式 。 
a.7.187 5 b. -12.640 625 c. 11.406 25 d. -0.375 
将 下 列 8 位 符号 加 绝对 值 表 示 的 整数 转换 成 十 进 制 数 。 
a. 01110111 b. 11111100 c. 01110100 d. 11001110 
将 下 列 十 进 制 数 转换 成 8 位 符号 加 绝对 值 表示 法 。 
a. 53 b. -107 c. -5 d. 154 


在 计算 机 中 表示 有 符号 数字 的 方法 之 一 是 二 进 制 反 码 。 在 这 种 表示 法 中 ， 表 示 正 数 时 我 们 将 
其 直接 存 为 二 进 制 数字 ; 表示 负数 时 ， 对 该 数字 进行 二 进 制 反 码 运算 。 将 下 列 十 进 制 数 转换 
成 8 位 二 进 制 反 码 表示 法 。 


a. 53 b. -107 c, -5 d. 154 
将 下 列 8 位 二 进 制 反 码 表示 的 数 转换 成 十 进 制 数 。 

a.01110111 b. 11111100 c.01110100 d. 11001110 

如 果 在 一 个 数 上 应 用 二 进 制 反 码 表示 法 转换 两 次 ， 将 会 得 到 原 数 。 在 下 面 的 数 上 试 试看 。 
a. 01110111 b. 11111100 c. 01110100 d. 11001110 


另 一 种 求 二 进 制 补 码 的 方法 是 首先 转换 成 二 进 制 反 码 表示 法 ， 然 后 把 结果 加 1 (二 进 制 加 法 将 
在 第 4 章 讲解 )。 试 用 两 种 方法 转换 下 面 的 数 ， 分 析 比 较 结果 。 

a.01110111 b. 11111100 c. 01110100 d. 11001110 

在 十 进 制 数 中 ， 与 二 进 制 反 码 对 等 的 称 为 十 进 制 反 码 (1 =2-1 和 9 = 10 一 1)。 对 于 位 的 
单元 ， 我 们 用 十 进 制 反 码 表 示 数 字 的 范围 是 -[(10" / 2) - 1] 到 +[(10" / 2) -~ 1]。 带 及 个 数码 
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P3-28 


P3-29 


P3-30 


P3-31 


P3-32 


P3-33 


P3-34 


的 十 进 制 反 码 数字 通过 下 面 的 方法 获得 : 如 果 数 字 为 正 ， 十 进 制 反 码 就 是 其 自身 ;如果 数字 
为 负 ， 我 们 将 每 个 数码 减 9。 针 对 3 个 数码 位 的 单元 回答 以 下 问题 ; 
a. 使 用 十 进 制 反 码 可 表示 的 数字 范围 是 多 少 ? 
b. 该 系统 中 我 们 如 何 决定 数字 的 符号 ? 
c. 在 该 系统 中 我 们 会 有 两 个 0 吗 ? 
d. 如 果 e 的 答案 是 肯定 的 ， 表 示 +0 和 -0 的 是 什么 ? 
求 出 下 列 数 的 十 进 制 反 码 ， 假 设 只 有 3 个 数码 位 。 
a, +234 b. +560 c. -125 d. -111 
在 十 进 制 数 中 ， 与 二 进 制 补 码 对 等 的 称 为 十 进 制 补 码 (在 二 进 制 系统 中 ，2 是 底 ; 在 十 进 制 系 
统 中 ，10 是 底 )。 对 于 nn 位 的 单元 ,我们 用 十 进 制 补 码 表示 数字 的 范围 是 : 
- (10”2) 到 + (10Y2-1 ) 

带 有 个 数码 的 十 进 制 补 码 数字 通过 下 面 的 方法 获得 : 先 求 出 该 数字 的 十 进 制 反 码 ， 接 
着 给 结果 加 1。 针 对 3 个 数码 位 的 单元 回答 以 下 问题 ; 
a. 使 用 十 进 制 补 码 可 表示 的 数字 范围 是 多 少 ? b. 该 系统 中 我 们 如 何 决定 数字 的 符号 ? 
c. 在 该 系统 中 我 们 会 有 两 个 0 吗 ? d. 如 果 c 的 答案 是 肯定 的 ， 表示 +0 和 -0 的 是 什么 ? 
求 出 下 列 数 的 十 进 制 补 码 ， 假 设 只 有 3 个 数码 位 。 
a. +234 b. +560 c. -125 d. -111 
在 十 六 进 制 数 中 ， 与 二 进 制 反 码 对 等 的 称 为 十 六 进 制 反 码 (1=2-1 和 15=16-1)。 
a. 3 个 数码 位 使 用 十 六 进 制 反 码 可 表示 的 数字 范围 是 多 少 ? 
b, 在 十 六 进 制 系 统 中 如 何 获得 十 六 进 制 反 码 ? 
c. 在 该 系统 中 我 们 会 有 两 个 0 吗 ? 
d. 如 果 c 的 答案 是 肯定 的 ， 表 示 +0 和 -0 的 是 什么 ? 
求 出 下 列 数 的 十 六 进 制 反 码 ， 假 设 只 有 3 个 数码 位 。 
a. +B14 b. +FE!1 c. -1A d. -1E2 
在 十 六 进 制 数 中 ， 与 二 进 制 补 码 对 等 的 称 为 十 六 进 制 补 码 。 
a. 3 个 数码 位 使 用 十 六 进 制 补 码 可 表示 的 数字 范围 是 多 少 ? 
b. 在 十 六 进 制 系统 中 如 何 获得 十 六 进 制 补 码 ? 
c. 在 该 系统 中 我 们 会 有 两 个 0 吗 ? 
d. 如 果 e 的 答案 是 肯定 的 ， 表 示 +0 和 -0 的 是 什么 ? 
求 出 下 列 数 的 十 六 进 制 补 码 ， 假 设 只 有 3 个 数码 位 。 
a. +B14 b. +FEIl c. -1A d. -1E2 
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数据 运算 


在 第 3 章 中 ,我 们 讲述 了 如 何在 计算 机 中 存储 不 同类 型 的 数据 。 本 章 将 讲述 如 何在 这 些 
存 俏 在 计算 机 中 的 数据 上 进行 运算 。 数 据 上 的 运 舞 可 以 分 为 三 三 大 类 : 算术 运算 、 移 位 运算 和 
逻辑 运算 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 列 出 在 数据 上 进行 的 三 类 运算 ; 

。 在 位 模式 上 进行 一 元 和 二 元 逻辑 运算 ; 

。 区 分 逻辑 移 位 运算 和 算术 移 位 运算 ; 

。 在 位 模式 上 进行 逻辑 移 位 运算 ; 

。 在 以 二 进 制 补 码 形式 存储 的 整数 上 进行 算术 移 位 运算 ; 

。 在 以 二 进 制 补 码 形式 存储 的 整数 上 进行 加 法 和 减法 运算 ; 

。 在 以 符号 加 绝对 值 形式 存储 的 整数 上 进行 加 法 和 减法 运算 ; 

。 在 以 浮 点 格式 存储 的 实数 上 进行 加 法 和 减法 运算 ，; 

。 理解 逻辑 和 移 位 运算 的 一 些 应 用 ， 如 置 位 、 复 位 和 指定 位 的 反 转 等 。 


4.1 逻辑 运算 

在 第 3 章 中 ,我 们 讨论 了 计算 机 中 的 数据 是 以 位 模式 存储 的 事实 。 逻 辑 运 算是 指 那些 应 
用 于 模式 中 的 一 个 二 进 制 位 ， 或 在 两 个 模式 中 相应 的 两 个 二 进 制 位 的 相同 基本 运算 。 这 意味 
着 我 们 可 以 在 位 层次 上 和 模式 层次 上 定义 逻辑 运算 。 模 式 层 次 上 的 逻辑 运算 是 具有 相同 类 型 
的 位 层次 上 的 n 个 逻辑 运算 ， 这 里 的 n 就 是 模式 中 的 位 的 数目 。 


4.1.1 位 层次 上 的 逻辑 运算 

一 个 位 可 能 是 0 或 1， 可 以 假设 “0” 代 表 逻 辑 “ 假 ”"， 而 “1” 代 表 人 逻辑 “ 真 ”。 我 们 
可 以 应 用 布尔 代数 中 定义 的 运算 去 操纵 二 进 制 位 。 为 纪念 乔治 : 布尔 (George Boole) 而 命 
名 的 布尔 代数 属于 远 辑 的 特殊 数学 领域 。 附 录 卫 将 介绍 布尔 代数 和 它 在 计算 机 逻辑 电路 中 
的 应 用 。 本 节 我 们 将 简单 介绍 4 种 被 用 来 操纵 二 进 制 位 的 位 层次 上 的 运算 : 非 (NOT)、 与 
(AND)、 或 (OR) 和 蜡 或 (XOR)。 


布尔 代数 和 远 辑 电路 将 在 附录 上 中 讨 认 
图 4-1 显示 了 这 4 种 位 层次 上 运算 的 符号 及 其 真 值 表 。 真 值 表 定义 了 对 于 每 一 种 可 能 的 


输入 的 输出 值 。 注 意 ， 每 个 运算 符 的 输出 总 是 一 位 ,但 输入 可 以 是 一 位 或 两 位 。 


1. 非 (NOT) 
NOT 运算 符 是 一 元 操作 符 : 它 只 有 一 个 输入 。 输 出 位 与 输入 位 相反 ， 如 果 输 入 是 0， 
则 输出 为 1 ; 如 果 输 入 为 1， 则 输出 为 0。 换言之 ，NOT 运算 符 是 输入 的 反 转 。NOT 运算 符 





的 真 值 表 只 有 两 行 ， 因 为 单个 输入 只 有 两 种 可 能 : 0 或 1。 


x -> 一 NOTx 








x XOR yy 








图 4-1 位 层次 上 的 逻辑 运算 


2. 与 (AND) 

AND 运算 符 是 二 元 运算 符 : 它 有 两 个 输入 。 如 果 输 入 都 是 1， 则 输出 为 1， 而 在 其 他 
三 种 情况 下 ， 输 出 都 是 0。AND 运算 符 的 真 值 表 有 4 行 ， 因 为 两 个 输入 有 4 种 可 能 的 输入 
组 合 。 

特性 

AND 运算 符 有 趣 的 一 点 是 : 如 果 一 个 输入 中 有 一 位 是 0， 则 不 需要 检查 其 他 输入 中 的 
相应 的 位 ， 便 可 迅速 得 到 结果 为 0。 当 我 们 讨论 此 运算 符 在 位 模式 层次 上 的 应 用 时 ， 我 们 将 
用 到 这 个 特性 。 

对 于 天 0 或 个人 AND0 二 0 和 :OANDz-0 

3. 或 (OR) 

OR 运算 符 也 是 二 元 运算 符 : 它 有 两 个 输入 。 如 果 输 入 都 是 0， 则 输出 为 0， 而 在 其 他 
三 种 情况 下 ， 输 出 都 是 1。OR 运算 符 的 真 值 表 也 有 4 行 。 OR 运算 符 有 时 称 为 包含 或 运算 符 ， 
因为 输出 值 为 1 时 ， 不 但 有 其 中 一 个 输入 为 1， 而 且 还 有 两 个 输入 都 是 1。 这 与 我 们 下 面 要 
介绍 的 运算 符 相 对 照 。 


特性 
OR 运算 符 有 趣 的 一 点 是 : 如 果 一 个 输入 中 有 一 位 是 1， 则 不 需要 检查 其 他 输入 中 的 相 


应 的 位 ， 便 可 迅速 得 到 结果 为 1。 当 我 们 讨论 此 运算 符 在 位 模式 层次 上 的 应 用 时 ， 我 们 将 用 
到 这 个 特性 。 

4. 异 或 (XOR) 

XOR 运算 符 (发 音 为 “exclusive-or”) 像 或 运算 符 一 样 也 是 二 元 运算 符 ， 只 是 有 一 点 
不 同 : 如 果 输 入 都 是 1， 则 输出 为 0。 我 们 能 用 另 一 种 方式 来 看 这 个 运算 符 : 当 输 入 相同 时 ， 
则 输出 为 0; 当 输入 不 同时 ， 则 输出 为 1。 


52 务 了 募 


在 英语 中 ， 我 们 使 用 连词 “或 ”时 ， 有 时 意思 是 包含 或 ， 有 时 意思 却 是 异 或 。 
a, 句子 “ITwish to have a car or a house” 使 用 的 “or” 就 是 包含 或 的 意思 ， 我 希望 有 一 


辆 车 ， 一 栋 房 子 ， 或 二 者 兼 而 有 之 。 
b. 句子 “Today is either Monday or Tuesday” 使 用 的 “or” 就 是 异 或 的 意思 ， 今 天 可 以 


RE 但 不 能 两 个 都 是 。 
XOR 运算 符 其 实 不 是 新 的 运算 符 ， 我 们 能 用 其 他 三 个 运算 符 来 模拟 它 。 下 面 
所 人 是 等 人 的 : 
xXORy [xAND (NOTy)] OR[(NOTx)ANDy] 
如 果 我 们 给 出 两 个 表达 式 的 真 值 表 ， 等 价 就 可 以 得 到 证 明 。 


特性 
XOR 的 特性 是 : 如 果 输 入 中 的 一 位 是 1， 那 结果 就 是 与 其 他 输入 中 相应 位 相反 。 当 我 


dea ea, 时 ， 我 们 将 用 到 这 个 特性 。 
SS “对 于 x 二 0 或 1 xXOR1—NOTX 和 XXOR1—>NOTx 汉人 和 








4.1.2 ”模式 层次 上 的 逻辑 运算 


相同 的 4 个 运算 符 (NOT、AND、OR 和 XOR) 可 以 被 应 用 到 位 模式 。 效 果 就 是 对 
NOT 运算 来 说 ， 把 每 个 运算 符 应 用 于 每 个 位 ， 对 于 其 他 3 个 运算 符 就 是 把 每 个 运算 符 应 用 
于 相应 的 位 对 。 图 4-2 显示 了 带 输入 和 输出 模式 的 4 个 运算 符 。 


n 位 nn 位 





4-2 应 用 于 位 模式 的 逻辑 运算 符 


用 NOT ( 非 ) 运算 符 来 计算 位 模式 10011000。 
解 ”结果 显示 如 下 ,注意 NOT 运算 符 把 每 个 0 变 成 1， 把 每 个 1 变 成 0。 
NOT 100 1110.0 .0 输入 
Ho 让 Dr A js A 和 人 输出 
用 AND (与 ) 运算 符 来 计算 位 模式 10011000 和 00101010。 
解 ”结果 显示 如 下 ,注意 只 有 输入 中 相应 的 位 都 为 1， 输出 中 的 位 才 为 1。 








II00Li00 0 输入 1 
AND 0 0 10 10 .10 输入 2 
00 0 0 1 .030; 0， 输出 


对 位 模式 数值 10011001 和 00101110 应 用 OR (或 ) 运算 。 

解 ”结果 显示 如 下 ， 注 意 只 有 输入 中 相应 的 位 都 为 0， 输 出 中 的 位 才 为 0。 
100 1 1001 输入 ] 

OR 00101110 输入 2 
00.120 5 人 榆 出 





发 据 远 攻 





忆 下 吕 外 ”使 用 XOR ( 异 或 ) 运算 符 对 10011001 和 00101110 位 运算 。 
解 ”结果 显示 如 下 ， 比 较 本 例 的 结果 与 上 例 的 结果 。 唯 一 的 不 同 是 当 输入 中 相应 的 位 都 


为 1 时 ， 输 出 中 的 位 才 为 0。 





上 输入 1 
OR 和 | 人 TFT LT 输入 2 
LIEOSITSWOESSAERN 输出 
应 用 
4 种 逻辑 运算 能 被 用 来 修改 位 模式 。 
求 反 


” ”NOT 运算 符 的 唯一 应 用 就 是 对 整个 模式 求 反 。 对 模式 应 用 此 运算 符 把 每 个 0 变 成 1， 
把 每 个 1 变 成 0。 这 种 方式 有 时 候 也 称 为 一 个 求 反 运 算 。 例 4-3 显示 了 求 反 的 效果 。 

使 指定 的 位 复位 

AND 运算 的 一 个 应 用 就 是 把 一 个 位 模式 的 指定 位 复位 ( 置 0 )。 这 种 情况 下 的 第 二 个 输 
人 称 为 掩 码 。 掩 码 中 的 0 位 对 第 一 个 输入 中 相应 的 位 进行 复位 。 掩 码 中 的 1 位 使 得 第 一 个 
输入 中 相应 的 位 保持 不 变 。 这 是 由 我 们 提 到 过 的 AND 运算 符 的 特性 决定 的 : 如 果 输 入 中 有 
一 个 是 0， 不管 其 他 输入 是 什么 ,输出 都 是 0。 模式 中 的 复位 有 许多 应 用 ， 例 如 ， 如 果 一 个 
图 像 使 用 的 是 每 像素 只 有 一 位 (黑白 图 像 )， 那 么 我 们 能 使 用 掩 码 和 AND 运算 符 使 指定 像素 
变 黑 。 

使 用 掩 码 复位 模式 的 最 左 5 位 。 用 模式 10100110 测试 掩 码 。 

解 ” 掩 码 是 00000111， 应 用 掩 码 的 结果 是 ，; 


Li 输入 
AND QI0 0 001 掩 码 
EE 和 输出 
注意 最 右边 的 3 位 保持 不 变 ， 而 最 左边 5 位， 不 管 它们 先前 的 值 是 什么 ， 都 被 复位 ( 变 
为 0 )。 
对 指定 的 位 置 位 


OR 运算 的 一 个 应 用 是 把 一 个 位 模式 的 指定 位 置 位 ( 置 1 )。 我 们 再 次 使 用 掩 码 ， 但 是 一 

个 不 同 的 掩 码 。 掩 码 中 的 1 位 对 第 一 个 输入 中 的 相应 的 位 进行 置 位 ， 而 掩 码 中 的 0 位 使 第 
一 个 输入 中 相应 的 位 保持 不 变 。 这 是 由 我 们 提 到 的 OR 运算 符 的 特性 决定 的 : 如果 一 个 输入 

为 1， 不管 其 他 输入 是 什么 ,输出 都 将 是 1。 模 式 中 的 位 置 位 有 许多 应 用 ， 例 如 ， 如 果 一 个 
图 像 使 用 的 是 每 像素 只 有 一 位 (黑白 图 像 )， 那 么 我 们 能 使 用 掩 码 和 OR 运算 符 使 指定 像素 
正和 白 。 

使 用 掩 码 把 一 个 位 模式 的 最 左 5 位 置 位 。 使 用 10100110 测试 这 个 掩 码 。 

解 ” 此 掩 码 为 11111000。 应 用 此 掩 码 的 结果 为 : 


1 和 输入 
OR 1 Li i1000 掩 码 
输出 


使 指定 的 位 反 转 
XOR 运算 的 一 个 应 应 用 是 使 指定 的 位 反 转 ， 我 们 再 次 使 用 掩 码 ， 但 是 一 个 不 同 的 掩 码 。 


54 务 了 4 个 


掩 码 中 的 1 位 对 第 一 个 输入 中 的 相应 的 位 进行 反 转 ， 而 掩 码 中 的 0 位 使 第 一 个 输入 中 相应 的 
位 保持 不 变 。 这 是 由 我 们 提 到 的 XOR 运算 符 的 特性 决定 的 : 如果 一 个 输入 为 1， 输出 与 相 
应 的 位 相反 。 注 意 NOT 运算 符 和 XOR 运算 符 间 的 区 别 。NOT 运算 符 是 将 输入 中 所 有 的 位 
求 反 ， 而 XOR 运算 符 只 是 对 第 一 个 输入 中 指定 的 位 求 反 ， 正 如 掩 码 中 所 定义 的 。 
用 掩 码 来 反 转 一 个 模式 的 最 左边 5 位 。 用 模式 10100110 检验 掩 码 。 
解 ” 掩 码 为 11111000。 运 用 掩 码 后 的 结果 为 : 
El 
XOR 1 11 1 10 0 0 掩 码 
1 0 


4.2 移 位 运算 
移 位 运算 移动 模式 中 的 位 ， 改 变 位 的 位 置 。 它 们 能 向 左 或 向 右 移动 位 。 我 们 可 以 把 移 位 
运算 分 成 两 大 类 : 逻辑 移 位 运算 和 算术 移 位 运算 。 


4.2.1 逻辑 移 位 运算 

逻辑 移 位 运算 应 用 于 不 带 符号 位 的 数 的 模式 。 原 因 是 这 些 移 位 运算 可 能 会 改变 数 的 符 
号 ， 此 符号 是 由 模式 中 最 左 位 定义 的 。 我 们 区 分 两 类 逻辑 移 位 运算 ， 如 下 面 描述 。 

1. 逻辑 移 位 

逻辑 右 移 运 算 把 每 一 位 向 右 移动 一 个 位 置 。 在 4 位 模式 中 ， 最 右 位 丢失 ， 最 左 位 填 
0。 逻 辑 左 移 运 算 把 每 一 位 向 左 移动 一 个 位 置 。 在 位 模式 中 ， 最 左 位 丢失 ， 最 右 位 填 0。 
图 4-3 显示 了 对 一 个 8 位 模式 的 逻辑 右 移 和 逻辑 左 移 。 


/Pp ,EE EE sf 


0 丢失 ”丢失 
a) 逻辑 右 移 b) 逻辑 左 移 


图 4-3 ”逻辑 移 位 运算 


对 位 模式 10011000 使 用 逻辑 左 移 运算 。 

村 加 下 所 不， 最 人 和 弃 ，0 作为 位 被 
00 0 霹 1 090 0% 原始 的 
io 1 3 0 了 0 移 位 后 


IF 












2. 循环 移 位 

循环 移 位 运算 (旋转 运算 ) 对 位 进行 移 位 ， 但 没有 位 被 丢弃 或 增加 。 循 环 右 移 (或 右 旋 
转 ) 把 每 一 位 向 右 移动 一 个 位 置 ， 最 右 位 被 回环 ， 成 为 最 左 位 。 循 环 左 移 (或 左旋 转 ) 把 每 
一 位 向 左 移动 一 个 位 置 ， 最 左 位 被 回环 ， 成 为 最 右 位 。 图 4-4 显示 了 循环 左 移 和 循环 右 移 


运算 。 








| | 


a) 循环 右 移 b) 循环 左 移 
图 4-4 ”循环 移 位 运算 


禾 据 运 灌 


对 位 模式 10011000 使 用 循环 左 移 运算 。 
解 ” 解 如 下 所 示 ， 最 左 位 (黑色 背景 中 的 白字 ) 被 回环 ， 成 为 最 右 位 。 
原始 的 040 1100.0 回环 


移 位 后 0 0 I 1 "0 0 二 

Eb 逻辑 运算 和 逻辑 移 位 运算 给 我 们 提供 了 操纵 位 模式 的 工具 。 假 设 有 一 个 模 

式 ， 在 判断 过 程 中 需要 使 用 此 模式 的 第 三 位 (从 右 起 )， 需 要 知道 这 特殊 的 位 是 0 或 1。 下 面 
显示 了 如 何 找 出 这 位 。 









原始 的 模式 
一 次 右 移 

二 次 右 移 
掩 码 

结果 


我 们 先 对 模式 进行 两 次 右 移 ， 这 样 目标 位 被 移 到 最 右 的 位 置 。 然后 通过 最 右 位 为 1 其 余 
为 0 的 掩 码 和 AND 运算 就 能 得 出 结果 。 结 果 是 有 7 个 0， 目标 位 在 最 右 位置 的 模式 。 然 后 
可 以 测试 结果 : 如 果 它 是 无 符号 的 整数 1， 那 么 目标 位 就 是 1 ; 而 如 果 结 果 是 无 符号 的 整数 
0， 那 么 目标 位 就 是 0。 

3. 算术 移 位 运算 

算术 移 位 运算 假定 位 模式 是 用 二 进 制 补 码 格式 表示 的 带 符号 位 的 整数 。 算 术 右 移 被 用 来 
对 整数 除 以 2; 而 算术 左 移 被 用 来 对 整数 乘 以 2( 后 面 讨论 )。 这 些 运算 不 应 该 改变 符号 位 (最 
左 )。 算 术 右 移 保留 符号 位 ， 但 同时 也 把 它 复 制 ， 放 和 人 相 邻 的 右边 的 位 中 ， 因 此 符号 被 保存 。 
算术 左 移 丢 弃 符号 位 ， 接 受 它 的 左边 的 位 作为 符号 位 。 如 果 新 的 符号 位 与 原先 的 相同 ， 那 么 
运算 成 功 ， 和 否则 发 生 上 海 或 下 滋 ， 结 果 是 非法 的 。 图 4-5 显示 了 这 两 种 运算 。 


EE 


丢失 
a) 算术 右 移 b) 算术 左 移 


图 4-5 算术 移 位 运算 











对 位 模式 10011001 使 用 算术 右 移 ， 模 式 是 二 进 制 补 码 格式 的 整数 。 

解 ” 解 如 下 所 示 ， 最 左 位 被 保留 ， 被 复制 到 相 邻 的 右边 的 位 (黑色 背景 中 的 白字 ) 中 。 
1 本 0 全 1150 0 1 原始 的 

移 位 后 

原始 数 是 -103 ， 新 的 数 是 -52， 它 是 - 103 被 除 以 2 并 取 整 的 结果 。 

EE 对 位 模式 11011001 使 用 算术 左 移 ， 模 式 是 二 进 制 补 码 格式 的 整数 。 

解 ” 解 如 下 所 示 ， ei gt 











原始 数 是 -39， 新 的 数 是 -78， 原 冯 数 补 有 忆 2。 因 为 没有 下 滋 的 发 生 ， 所 以 运算 合法 。 
对 位 模式 01111111 使 用 算术 左 移 ， 模 式 是 二 进 制 补 码 格式 的 整数 。 


56 萌 4 摹 


解 ” 解 如 下 所 示 ， 最 左 位 ( 浅 色 字 ) 被 丢弃 ,0 作为 最 右 位 (黑色 背景 中 的 白字 ) 被 插 人 。 
算术 左 移 01 1 11 廊 1),E 原始 的 
i 1 1 1 NM 移 位 后 
原始 数 是 127， 新 的 数 是 -2。 因 为 上 滋 发 生 ， 所 以 结果 非法 。 期 望 的 答案 是 127X2 三 
254， 这 个 数 不 能 用 8 位 模式 表示 。 


4.3 算术 运算 
算术 运算 包括 加 、 减 、 乘 、 除 ， 适 用 于 整数 和 浮 点 数 。 


4.3.1 整数 的 算术 运算 


所 有 算术 运算 (如 加 、 减 、 乘 、 除 ) 均 适 用 于 整数 。 虽 然 整 数 的 乘法 (除法 ) 能 使 用 重 
复 的 加 法 (减法 ) 来 实现 ， 但 程序 是 低 效 的 。 对 于 滋 法 和 除法 有 更 高 效 的 程序 (如 Booth 程 
序 )， 但 这 些 超过 了 本 书 的 范围 ， 基 于 这 个 原因 ， 我 们 这 里 只 讨论 整数 的 加 法 和 减法 。 

1. 二 进 制 补 码 中 的 加 减法 

我 们 首先 讨论 二 进 制 补 码 表示 的 整数 的 加 法 和 减法 ， 这 是 因为 它 较 容 易 。 正 如 我 们 在 第 
3 章 讨论 的 ， 整 数 通常 是 以 二 进 制 补 码 形式 存储 的 。 二 进 制 补 码 表示 法 的 一 个 优点 是 加 法 和 
减法 间 没 有 区 别 。 当 遇 到 减法 时 ， 计 算 机 只 简单 地 把 它 转变 为 加 法 ,但 要 为 第 二 个 数 求 二 进 


制 的 补 。 换 言 之 : 





4-B+*4+(B+l1)， 这 里 的 (8+1 ) 表示 B 的 补 码 

这 就 意味 着 我 们 只 需要 讨论 加 法 。 二 进 制 补 码 中 的 加 法 就 像 十 进 制 中 的 加 法 一 样 : 列 与 
列 相 加 ， 如 果 有 进位 ， 就 加 到 下 一 列 上 。 但 是 ， 最 后 一 列 的 进位 被 舍弃 。 

记 住 ， 我 们 是 一 列 接 一 列 相 加 整数 的 。 在 每 一 列 中 ， 如 果 没 有 从 前 一 列 来 的 进位 ， 那 就 
有 两 位 相 加 ; 或 者 如 果 有 从 前 一 列 来 的 进位 ， 那 就 有 三 位 相 加 。 

现在 我 们 能 显示 两 个 用 二 进 制 补 码 格式 表示 的 整数 的 加 法 或 减法 过 程 (图 4-6 )。 注 意 
我 们 使 用 (万 +1 ) 表示 天 的 补 码 ， 因 为 存 表 示 的 无 反 码 ， 所 以 这 种 记号 非常 常见 。 如 果 给 
一 个 整数 的 反 码 加 1， 就 得 到 它 的 补 码 。 





图 4-6 二 进 制 补 码 格式 表示 的 整数 的 加 法 和 减法 


过 程 如 下 : 
1 ) 如 果 运 算是 减法 ， 我 们 取 第 二 个 整数 的 二 进 制 补 码 ， 否 则 ， 转 下 一 步 。 
2 ) 两 个 整数 相 加 。 


红 据 运 漠 


El 以 二 进 制 补 码 格 式 存 储 两 个 整数 4 和 8B， 显 示 8 是 如 何 被 加 到 4 上 的 。 
A=(00010001)。 B=(00010110); 
解 ” 运 算是 相 加 ，4 被 加 到 B 上， 结果 存储 在 R 中 。 








eats (tt ey 
用 十 进 制 检 查 结 果 : (+17) + (+22) = (+39)。 
EE 以 二 进 制 补 码 格式 存储 两 个 整数 4 和 B， 显 示 8 是 如 何 被 加 到 4 上 的 。 
4=(00011000) B=(11101111); 
解 ” 运 算是 相 加 ，4 被 加 到 8B 上， 结果 存储 在 RR 中。 注意 ,最 后 的 进位 被 舍弃 ， 因 为 存 
储 器 大 小 只 有 8 位 。 











1 和 i 进位 
0 0 4 
B 
3 et eT RR 





用 十 进 制 检查 结果 : (+24) + (-17) = (+7)。 

以 二 进 制 补 码 格式 存储 两 个 整数 4 和 B， 显 示 如 何 从 4 中 减 去 B。 
A=(00011000)。 B=(11101111); 

解 ” 运 算是 相 减 ，4 被 加 到 (B+1 ) 上 ， 结 果 存 储 在 尺 中 。 








用 十 进 制 检查 结果 : (+24) - (-17) = (+41)。 
以 二 进 制 补 码 格式 存储 两 个 整数 4 和 下， 显示 如 何 从 4 中 减 去 B。 
4=(11011101) B=(00010100); 
解 ” 运 算是 相 减 ，4 被 加 到 (8+1) 上 ， 结 果 存 储 在 RR 中。 
二 进位 
1 








用 十 进 制 检查 结果 : (- 35) - 的 a 55)。 人 “最 后 的 进位 被 舍弃 。 

ES 以 二 进 制 补 码 格 式 存 储 两 个 整数 4 和 B， 显 示 B 如 何 被 加 到 4 上 。 
A=(01111111),。 8=(00000011); 

解 ” 运 算是 相 加 ，4 被 加 到 B 上， 结果 存 储 在 RR 中 。 





芳子 划 


我 们 期 望 的 结果 是 127 + 3 = 130， 但 答案 是 -126。 错 误 是 由 于 上 溢 ， 因 为 期 望 的 答案 
(+130 ) 不 在 范围 -128 一 +127 之 间 。 


党 我 们 昌 行 让 机 中 数字 上 的 午 术 二 算 对 ， 要 记 信和 数字 和 结 应 访 人 本 的 二 
进 制 位 的 定义 范围 之 内 。 “ Ee 


2. 符号 加 绝对 值 整数 的 加 减法 

用 符号 加 绝对 值 表示 的 整数 的 加 法 和 减法 看 起 来 非常 复杂 。 我 们 有 4 种 不 同 的 符号 组 合 
(两 个 符号 ， 每 个 有 两 个 值 )， 对 于 减法 有 4 种 不 同 的 条 件 。 这 就 意味 着 我 们 要 考虑 8 种 不 同 
的 情况 。 对 于 那些 对 此 感 兴 趣 的 读者 ， 我 们 在 附录 I 中 对 这 些 情况 进行 了 具体 的 描述 。 


4.3.2 ”实数 的 算术 运算 

像 加 、 减 、 乘 和 除 这 样 的 算术 运算 都 能 应 用 于 用 浮 点 数 格式 存储 的 实数 上 。 两 实数 的 乘 
法 涉及 两 个 用 符号 加 绝对 值 表 示 的 整数 的 乘法 ; 两 实数 的 除法 涉及 两 个 用 符号 加 绝对 值 表示 
的 整数 的 除法 。 既 然 我 们 不 讨论 用 符号 加 绝对 值 表示 的 整数 的 乘法 或 除法 ， 那 我 们 也 不 讨论 
实数 的 乘法 和 除法 ， 并 仅 在 附录 J 中 讨论 实数 的 加 法 和 减法 。 


4.4 章 末 材 料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
e Mano, M. Computer System Architecture, Upper Saddle River, NJ: Prentice-Hall, 1993 
es。 Null, L, and Lobur, J. Computer Organization and Architecture, Sudbury, MA: Jones and 


Bartlett, 2003 
e Stalling, W. Computer Organization and Architecture, Upper Saddle River, NJ: Prentice- 


Hall, 2000 

关键 术语 
本 章 引 进 了 以 下 关键 术语 ， 将 它们 及 其 首次 出 现 的 页 数列 举 如 下 : 
AND operation (AND 运算 ) mask( 掩 码 ) 
arithmetic operation (算术 运算 ) NOT operation (NOT 运算 ) 
arithmetic shift operation (算术 移 位 运算 ) OR operation (OR 运算 ) 
Boolean algebra (布尔 代数 ) truth table ( 真 值 表 ) 
circular shift operation (循环 移 位 运算 ) XOR operation (XOR 运算 ) 
logical shift operation (逻辑 移 位 运算 ) 


小 结 
。 数据 上 的 运算 分 成 三 大 类 : 逻辑 运算 、 移 位 运算 和 算术 运算 。 逻 辑 运算 是 指 那些 应 用 
于 位 模式 单独 位 或 两 模式 中 相应 的 两 位 上 的 相同 基本 运算 。 移 位 运算 移 到 模式 中 的 


位 。 算 术 运 算 涉 及 加 、 减 、 乘 和 除 。 
。 本 章 讨 论 了 4 种 逻辑 运算 (NOT、AND、OR 和 XOR)， 它 们 能 用 在 位 层次 或 模式 层 
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4.5 


次 上 。NOT 运算 符 是 一 元 运算 符 ， 而 AND、OR 和 XOR 是 二 元 运算 符 。 

NOT 运算 符 的 唯一 应 用 就 是 对 整个 模式 求 反 ; AND 运算 符 的 一 个 应 用 就 是 对 位 模式 
中 指定 的 位 进行 复位 ( 置 为 0); OR 运算 符 的 一 个 应 用 就 是 对 位 模式 中 指定 的 位 进行 
置 位 〈 置 为 1 ); XOR 运算 符 的 一 个 应 用 就 是 对 位 模式 中 指定 的 位 进行 反 转 ( 求 反 )。 

移 位 运算 移 到 模式 中 的 位 : 它们 改变 位 的 位 置 。 我 们 能 把 移 位 运算 分 成 两 类 : 逻辑 移 
位 和 算术 移 位 。 逻 辑 移 位 被 应 用 于 不 表示 为 符号 数 的 模式 ; 算术 移 位 假定 位 模式 是 二 
进 制 补 码 格式 的 符号 整数 。 

像 加 、 减 、 乘 和 除 这 样 的 所 有 的 算术 运算 都 能 应 用 于 整数 。 整 数 通常 是 存储 在 二 进 制 
补 码 格式 中 的 。 二 进 制 补 码 格式 表示 的 一 个 优点 就 是 加 法 和 减法 间 没 有 不 同 。 当 遇 到 
减法 时 ， 计 算 机 简单 地 把 它 改 变 为 加 法 运算 ， 然 而 此 时 对 第 二 个 数 而 言 是 求 反 运 算 。 
用 符号 加 绝对 值 表示 的 整数 的 加 法 和 减法 看 起 来 非常 复杂 ， 我 们 需要 考虑 8 种 情况 。 

像 加 、 减 、 乘 和 除 这 样 的 所 有 的 算术 运算 都 能 应 用 于 用 浮 点 数 表示 的 实数 ， 用 浮 点 数 
表示 的 实数 的 加 法 和 减法 归纳 为 小 数 点 对 齐 后 的 存储 在 符号 加 绝对 值 中 的 两 整数 的 加 
法 和 减法 。 


练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q4-1 
Q4-2 
Q4-3 
Q4-4 
Q4-5 
Q4-6 
Q4-7 
Q4-8 
Q4-9 
Q4-10 
Q4-11 
Q4-12 
Q4-13 
Q4-14 
Q4-15 
Q4-16 
Q4-17 
Q4-18 
Q4-19 


算术 运算 和 逻辑 运算 有 什么 区 别 ? 

在 二 进 制 补 码 格 式 的 整数 相 加 中 ， 最 左边 一 列 是 怎样 进位 的 ? 
n 的 位 分 配 单 元 可 以 等 于 1 吗 ? 为 什么 ? 

解释 “溢出 ”这 个 词 。 

在 浮 点 数 的 加 法 运算 中 ， 怎 样 调整 指数 不 同 的 数 的 表示 方法 ? 
一 元 运算 和 二 元 运算 有 何不 同 ? 

二 元 逻辑 运算 有 了 哪些? 

什么 是 真 值 表 ? 

NOT 运算 符 的 作用 是 什么 ? 

AND 运算 符 的 结果 何 时 为 真 ? 

OR 运算 符 的 结果 何 时 为 真 ? 

XOR 运算 符 的 结果 何 时 为 真 ? 

说 出 AND 运算 符 本 章 讨论 的 一 个 重要 特性 。 

说 出 OR 运算 符 本 章 讨论 的 一 个 重要 特性 。 

说 出 XOR 运算 符 本 章 讨论 的 一 个 重要 特性 。 

何 种 二 元 运算 可 以 用 来 置 位 ? 掩 码 应 该 用 什么 位 模式 ? 

何 种 二 元 运算 可 以 用 来 复位 ? 掩 码 应 该 用 什么 位 模式 ? 

何 种 二 元 运算 可 以 用 来 反 转 ? 掩 码 应 该 用 什么 位 模式 ? 
逻辑 和 算术 移 位 间 的 区 别 是 什么 ? 
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练习 题 


P4-1 求 下 列 运算 的 结果 : 
a. NOT (99)ie b. NOT (FF)is ¢. NOT (00)s d. NOT (01)w 


P4-2 求 下 列 运 算 的 结果 : 
a. (99)is AND (99);s  b. (99)is AND (00)i。 cc. (99)is AND (FF)is。 dd. (FF)is AND (FF),s 


P4-3 求 下 列 运算 的 结果 : 
a. (99)1s OR (99)¢ b. (99)1s OR (00)'s c. (99)1s OR (FF)s d. (FF)is OR (FF)'s 
P4-4 求 下 列 运 算 的 结果 ; 
a. NOT[(99)1s OR (99)i4] 
b. (99)is OR [NOT (00),4] 
c. [(99)1s AND (33);s] OR [(00)1s AND (FF)i6] 
d. (99)1s OR (33)is AND [(00)is OR (FF);g] 
P4-5 要 将 一 个 位 模式 的 最 左 4 位 复位 ( 置 0),， 求 掩 码 和 运算 。 
P4-6 ”要 将 一 个 位 模式 的 最 右 4 位置 位 ( 置 1 ), 求 掩 码 和 运算 。 
P4-7 要 将 一 个 位 模式 的 最 右 3 位 和 最 左 2 位 反 转 ， 求 掩 码 和 运算 。 
P4-8 要 将 一 个 位 模式 的 最 左 3 位 和 最 右 2 位 复位 ， 求 掩 码 和 运算 。 
P4-9 用 移 位 运算 将 一 个 无 符号 数 除 以 4。 
P4-10 ”用 移 位 运算 将 一 个 无 符号 数 乘 以 8。 
P4-11 综合 使 用 逻辑 和 移 位 运算 求 取 一 个 无 符号 数 的 第 4 和 5 位 。 
P4-12 用 8 位 分 配 单元 ， 先 把 下 列 数 转 换 成 二 进 制 补 码 ， 然 后 运算 ， 再 把 结果 转 成 十 进 制 。 


a, 19+23 b. 19-23 c, -19+23 d. -19-23 
P4-13 用 16 位 分 配 单 元 ， 先 把 下 列 数 转换 成 二 进 制 补 码 ， 然 后 运算 ， 再 把 结果 转 成 十 进 制 。 
a, 161+1023 b. 161-1023 c. -161+1023 d. -161-1023 
P4-14 如果 数字 和 结果 都 用 8 位 二 进 制 补 码 表 示 ， 下 列 哪个 运算 会 溢出 ? 
a. 11000010+00111111 b, 00000010+00111111 
c. 11000010+11111111 d. 00000010+11111111 
P4-15 ”如 果 数 字 和 结果 都 用 8 位 二 进 制 补 码 表示 ， 不 通过 实际 的 计算 ， 我 们 能 说 出 下 列 哪 个 运算 会 
溢出 吗 ? 
a, 32+105 b. 32-105 c. -32+105 d. -32-105 
P4-16 假设 数字 缘 以 16 位 二 进 制 补 码 表示 法 来 存储 ， 求 结果 。 假 设 以 十 六 进 制 表 示 法 ， 结 果 又 
如 何 ? 
a. (012A);s + (OE27);e b. (712A)ie + (9E00)s 
c. (8011)is + (0001),s d. (E12A)'s + (9E27)'e 
P4-17 使 用 一 个 8 位 的 分 配音 元， 首先 把 下 列 每 个 数字 转化 为 符号 加 绝对 值 表示 法 ， 进 行 运 算 ， 然 
后 把 结果 转化 为 十 进 制 。 
a. 19+23 b. 19-23 c. -19+23 d. -19-23 
P4-18 计算 下 列 使 用 IEEE_127 (参见 第 3 章 ) 的 浮 点 数 运算 结果 。 
a. 34.75+23.125 b. -12.625+451.00 
c. 33,1875-0.4375 d. -344.3125-123.5625 


P4-19 下 列 哪 种 情况 永 不 会 发 生 溢出 ? 证 明 你 的 观点 。 

a. 两 个 正 整数 相 加 “bb. 正 整数 加 负 整 数 。” “cc. 负 整 数 减 正 整数 。” ”dd. 两 个 负 整 数 相 减 
P4-20 ”把 一 个 整数 加 到 它 的 反 码 上 的 结果 是 什么 ? 
P4-21 把 一 个 整数 加 到 它 的 补 码 上 的 结果 是 什么 ? 
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本 章 我 们 将 讨论 计算 机 的 组 成 。 讲 解 每 台 计 算 机 是 如 何 由 三 个 子 系统 组 成 的 。 我 们 还 介 
绍 了 简单 假想 的 计算 机 ， 它 能 运行 简单 程序 ， 完 成 基本 的 算术 或 逻辑 运算 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 ; 

。 列 出 计算 机 的 三 个 子 系统 ; 

。 摘 述 计算 机 中 央 处 理 单 元 (CPU) 的 作用 ; 

。 描述 典型 计算 机 中 指令 周期 的 取 指 令 一 译 码 一 执行 阶段 ; 

。 描述 主 存储 器 和 它 的 地 址 空间 ; 

。 区 分 主 存储 器 和 缓存 ; 

。 定义 输入 /输出 子 系统 ; 

。 理解 子 系统 间 的 互相 连接 ， 列 出 不 同 总 线 系统 ; 

。 描述 输入 / 输出 编 址 的 不 同方 法 ; 

。 区 分 设计 计算 机 体系 结构 的 两 种 主要 趋势 ; 

。 理解 计算 机 是 如 何 使 用 管道 改善 吞吐 量 的 ; 

。 理解 并 行 处 理 是 如 何 改善 计算 机 的 吞吐 量 的 。 


5.1 引言 

计算 机 的 组 成 部 件 可 以 分 为 三 大 类 (或 子 系统 ) ; 中 央 处 理 单元 (CPU)、 主 存储 器 和 输 
人 /输出 子 系统 。 接 下 来 的 三 个 部 分 将 讨论 这 些 子 系统 以 及 如 何 将 这 些 子 系统 组 成 一 台 计 算 
机 。 图 5-1 给 出 了 组 成 计算 机 的 这 三 个 子 系统 。 


中 央 处 理 单元 (CPU ) 





输入 /输出 子 系统 
图 5-1 计算 机 硬件 ( 子 系统 ) 


5.2 中央 处 理 单元 
中 央 处 理 单元 (CPU) 用 于 数据 的 运算 。 在 大 多 数 体 系 结构 中 ， 它 有 三 个 组 成 部 分 : 算 
术 逻 辑 单元 (ALU)、 控 制 单元 、 寄 存 器 组 (图 5-2 )。 
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R: 数据 寄存 器 
IR: 指令 寄存 器 
中 央 处 理 单元 
图 5-2” 中央 处 理 单元 
5.2.1 算术 逻辑 单元 
算术 有 逻辑 单元 (ALU) 对 数据 进行 逻辑 、 移 位 和 算术 运算 。 
1. 逻辑 运算 


在 第 4 章 中 ,我 们 讨论 了 几 种 逻辑 运算 ， 如 : 非 、 与 、 或 和 异 或 。 这 些 运算 把 输入 数据 
作为 二 进 制 位 模式 ， 运 算 的 结果 也 是 二 进 制 位 模式 。 

2. 移 位 运算 

在 第 4 章 中 ， 我 们 讨论 了 数据 的 两 种 移 位 运算 : 逻辑 移 位 运算 和 算术 移 位 运算 。 逻 辑 移 
位 运算 用 来 对 二 进 制 位 模式 进行 向 左 或 向 右 的 移 位 ， 而 算术 运算 被 应 用 于 整数 。 它 们 的 主要 
用 途 是 用 2 除 或 乘 一 个 整数 。 

3, 算术 运算 

在 第 4 章 我 们 讨论 了 整数 和 实数 上 的 一 些 算 术 运 算 ， 我 们 提 到 有 些 运 算 能 被 更 高 效率 的 
硬件 实现 。 


5.2.2 宵 存 器 


寄存 器 是 用 来 存放 临时 数据 的 高 速 独 立 的 存储 单元 。CPU 的 运算 离 不 开 大 量 寄存 器 的 
使 用 。 其 中 的 一 些 寄存 器 可 参见 图 5-2。 

1. 数据 寄存 器 

在 过 去 ， 计 算 机 只 有 几 个 数据 寄存 器 用 来 存储 输入 数据 和 运算 结果 。 现 在 ， 由 于 越 来 越 
多 的 复杂 运算 改 由 硬件 设备 实现 (而 不 是 使 用 软件 )， 所 以 计算 机 在 CPU 中 使 用 几 十 个 寄存 
器 来 提高 运算 速度 ， 并 且 需 要 一 些 寄 存 器 来 保存 这 些 运算 的 中 间 结 果 。 在 图 5-2 中 ， 数 据 寄 
存 器 被 命名 为 Ri 到 R,。 

2. 指令 寄存 器 

现在 ， 计 算 机 存储 的 不 仅 是 数据 ， 还 有 存储 在 内 存 中 相对 应 的 程序 。CPU 的 主要 职责 


是 : 从 内 存 中 逐条 地 取出 指令 ， 并 将 取出 的 指令 存储 在 指令 寄存 器 (图 5-2 中 寄存 器 IR) 中 ， 
解释 并 执行 指令 。 我 们 将 在 接 下 来 的 小 节 中 讨论 这 个 问题 。 

3. 程序 计数 器 

CPU 中 另 一 个 通用 寄存 器 是 程序 计数 器 (图 5-2 中 的 PC 寄存 器 )。 程 序 计数 器 中 保存 着 当 
前 正在 执行 的 指令 。 当 前 的 指令 执行 完 后 ， 计 数 器 将 自动 加 1， 指向 下 一 条 指令 的 内 存 地 址 。 
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5.2.3 ”控制 单元 


CPU 的 第 三 个 部 分 是 控制 单元 ， 控 制 单元 控制 各 个 子 系统 的 操作 。 控 制 是 通过 从 控制 
单元 到 其 他 子 系统 的 信号 来 进行 。 


5.3” 主 存储 器 

主 存储 器 是 计算 机 内 的 第 二 个 子 系统 (图 5-3 )。 它 是 存储 单元 的 集合 ， 每 一 个 存储 单 
元 都 有 唯一 的 标识 ， 称 为 地 址 。 数 据 以 称 为 字 的 位 组 的 形式 在 内 存 中 传人 和 传 出 。 字 可 以 是 
8 位 、16 位 、32 位 ， 甚 至 有 时 是 64 位 (还 在 增长 )， 如 果 字 是 8 位 ， 一 般 称 为 1 字 节 。 术 语 
字 节 在 计算 机 科学 中 使 用 相当 普遍 ， 因 此 有 时 称 16 位 为 2 字 节 ，32 位 为 4 字 节 。 


地 址 一 > 0000000000|03U0DUOTGEO0DL LO0| < 一 内 容 ( 值 ) 


加 :A 3 
AL TE 
0000000001 00.00.0:0: I te 9 
I EA 
0000000010|111010170L1)0100 







1 总 多 | lo 
存储 器 
图 5-3 主 存储 器 


5.3.1 地 址 空间 


在 存储 器 中 存 取 每 个 字 都 需要 有 相应 的 标识 符 。 尽 管 程序 员 使 用 命名 的 方式 来 区 分 字 
《或 一 组 字 的 集合 )， 但 在 硬件 层次 上 ， 每 个 字 都 是 通过 地 址 来 标识 的 。 所 有 在 存储 器 中 标识 
的 独立 的 地 址 单元 的 总 数 称 为 地 址 空间 。 例 如 ， 一 个 64 KB、 字 长 为 1 字 节 的 内 存 的 地 址 空 
间 的 范围 为 0 一 65 535。 

表 5-1 给 出 了 经 常用 来 表示 存储 大 小 的 单位 名 称 。 注 意 这 些 专用 术语 可 能 有 误导 ， 好 像 
以 10 的 短 的 形式 来 近似 表示 字 书 数 ， 而 实际 上 字 节 的 数目 是 2 的 医 。 采 用 2 的 短 形 式 为 单 
位 使 得 寻 址 更 为 方便 。 


表 5-1 存储 单位 


作为 位 模式 的 地 址 

由 于 计算 机 都 是 以 位 模式 存储 数 并 进行 运算 ， 因 此 地 址 本 身 也 是 用 位 模式 表示 的 。 如 
果 一 个 内 存 是 64K (2“)， 字 长 为 1 字 节 ， 那 么 就 需要 16 位 的 位 模式 来 确定 地 址 。 回 顾 
第 3 章 我 们 曾经 提 到 地 址 用 无 符号 整数 表示 (不 用 负 的 地 址 )。 换 言 之 ， 起 始 地 址 通常 是 
0000000000000000 (地 址 0 )， 最 后 一 个 地 址 通常 是 1111111111111111 (地 址 65 535 )。 通 常 ， 如 
果 一 个 计算 机 有 N 个 字 的 存储 空间 ， 那 就 需要 有 logzN 位 的 无 符号 整数 来 确定 一 个 存储 单元 。 
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内 存 地 址 用 无 符号 二 进 制 整数 定义 。 


一 台 计 算 机 有 32 MB ( 兆 字 节 ) 内 存 。 需 要 多 少 位 来 寻 址 内 存 中 的 任意 一 个 
字 节 ? 

解 ” 内 存 地 址 空间 是 32 MB， 即 2” (25X22 )。 这 就 意味 着 需要 log:2”(25 位 ) 来 标 
识 每 一 个 字 节 。 

用 妈 和 一 台 计 算 机 有 128 MB 内 存 。 计 算 机 字 长 为 8 字 节 ， 需 要 多 少 位 来 寻 址 内 存 
中 任意 一 个 单字 ? 

解 ”内存 地 址 空间 是 128 MB ， 即 2”。 但 是 ， 每 个 字 是 8 ( 2; ) 字 节 ， 这 意味 着 需要 2” 
个 字 ， 也 就 是 说 你 要 log22%4 ( 24 位 ) 来 标识 每 一 个 字 。 


5.3.2 ”存储 器 的 类 型 


主要 有 两 种 类 型 的 存储 器 : RAM 和 ROM。 

1. RAM 

随机 存 取 存储 器 (RAM) 是 计算 机 中 主 存 的 主要 组 成 部 分 。 在 随机 存 取 设 备 中 ， 可 以 使 
用 存储 单元 地 址 来 随机 存 取 一 个 数据 项 ， 而 不 需要 存 取 位 于 它 前 面 的 所 有 数据 项 。 该 术语 有 
时 因为 ROM 也 能 随机 存 取 而 与 ROM 混淆 ，RAM 和 ROM 的 区 别 在 于 ， 用 户 可 读 写 RAM,， 
即 用 户 可 以 在 RAM 中 写 信 息 ， 之 后 可 以 方便 地 通过 覆盖 来 擦 除 原 有 信息 。RAM 的 另 一 个 
特点 是 易 失 性 。 当 系统 断 电 后 ， 信 息 (程序 或 数据 ) 将 丢失 。 换 句 话 说 ， 当 计算 机 断 电 后 ， 
存储 在 RAM 中 的 信息 将 被 删除 。RAM 技术 又 可 以 分 为 两 大 类 : SRAM 和 DRAM。 

SRAM 

静态 RAM ( SRAM) 技术 是 用 传统 的 触发 器 门 电 路 ( 见 附录 了 ) 来 保存 数据 。 这 些 门 保 
持 状态 (0 或 1 )， 也 就 是 说 当 通 电 的 时 候 数 据 始 终 存 在 ， 不 需要 刷新 。SRAM 速度 快 ， 但 是 
价格 昂贵 。 

DRAM 

动态 RAM (DRAM) 技术 使 用 电容 器 。 如 果 电 容器 充电 ， 则 这 时 的 状态 是 1 ; 如 果 放 
电 则 状态 是 0。 因为 电容 器 会 随时 间 而 漏 掉 一 部 分 电 ， 所 以 内 存单 元 需要 周期 性 地 刷新 。 
DRAM 比较 慢 ， 但 是 比较 便宜 。 

2. ROM 

只 读 存 储 器 (ROM) 的 内 容 是 由 制造 商 写 进去 的 。 用 户 只 能 读 但 不 能 写 ， 它 的 优点 是 非 
易 失 性 : 当 切 断 电源 后 ， 数 据 也 不 会 丢失 。 通 常用 来 存储 那些 关机 后 也 不 能 丢失 的 程序 或 数 
据 。 例 如 ， 用 ROM 来 存储 那些 在 开机 时 运行 的 程序 。 

3. PROM 

称 为 可 编程 只 读 存储 器 ( PROM) 的 一 种 ROM。 这 种 存储 器 在 计算 机 发 货 时 是 空白 的 。 
计算 机 用 户 借助 一 些 特 殊 的 设备 可 以 将 程序 存储 在 上 面 。 当 程序 被 存储 后 ， 它 就 会 像 ROM 
一 样 不 能 够 重 写 。 也 就 是 说 ， 计 算 机 使 用 者 可 以 用 它 来 存储 一 些 特定 的 程序 。 

4. EPROM 

称 为 可 擦 除 可 编程 只 读 存 储 器 (EPROM) 的 一 种 PROM。 用 户 可 以 对 它 进行 编程 ,但 
是 得 用 一 种 可 以 发 出 紫外 光 的 特殊 仪器 对 其 擦 写 。EPROM 存储 器 需要 拆 下 来 擦 除 再 重新 


安装 。 
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s. EEPROM 
称 为 电 可 擦 除 可 编程 只 读 存 储 器 ( EEPROM) 的 一 种 EPROM。 对 它 的 编程 和 擦 除 用 电 


子 脉冲 即 可 ， 无 须 从 计算 机 上 拆 下 来 。 


5.3.3 存储 器 的 层次 结构 
计算 机 用 户 需 要 许多 存储 器 ， 尤 其 是 速度 快 且 价格 低廉 的 存储 器 。 但 这 种 要 求 并 不 总 能 
得 到 满足 。 存 取 速 度 快 的 存储 器 通常 都 不 便 
宜 。 因 此 需要 寻找 一 种 折 中 的 办 法 。 解 决 的 办 
法 是 采用 存储 器 的 层次 结构 (图 5-4 )。 
。 当 对 速度 要 求 很 苛刻 时 可 以 使 用 少量 
高 速 存储 器 。CPU 中 的 寄存 器 就 是 这 
。 用 适量 的 中 速 存储 器 来 存储 经 常 需要 最 合家 
访问 的 数据 。 例 如 下 面 将 要 讨论 的 高 
速 缓冲 存储 器 就 属于 这 一 类 。 I 
。 用 大 量 的 低速 存储 器 存储 那些 不 经 常 访问 的 数据 。 主 存 就 属于 这 一 类 。 


5.3.4 高速 缓冲 存储 器 


高 速 缓冲 存储 器 的 存 取 速度 要 比 主 存 快 ， 但 是 比 CPU 及 其 内 部 的 寄存 器 要 惕 。 高 速 组 
冲 存 储 器 通常 容量 较 小 ， 且 常 被 置 于 CPU 和 主 存 之 间 (图 5-5 )。 








高 速 缓冲 存储 器 
图 5-5 高 速 缓冲 存储 器 


高 速 缓冲 存储 器 在 任何 时 间 都 含有 主 存 中 一 部 分 内 容 的 副本 。 当 CPU 要 存 取 主 存 中 的 
一 个 字 的 时 候 ， 将 按 以 下 步骤 进行 : 

1 ) CPU 首先 检查 高 速 缓冲 存储 器 。 

2 ) 如 果 要 存 取 的 字 存 在 ，CPU 就 将 它 复 制 ; 如 果 不 存 在 ，CPU 将 从 主 存 中 复制 一 份 从 
需要 读 取 的 字 开 始 的 数据 块 。 该 数据 块 将 覆盖 高 速 缓冲 存 储 器 中 的 内 容 。 

3 ) CPU 存 取 高 速 缓 神 存储 器 并 复制 该 字 。 

这 种 方式 将 提高 运算 的 速度 ; 如 果 字 在 高 速 缓冲 存储 器 中 ， 就 立即 存 取 它 。 如 果 字 不 在 
高 速 缓冲 存 储 器 中 ， 字 和 整个 数据 块 就 会 被 复制 到 高 速 缓冲 存储 器 中 。 因 为 很 有 可 能 CPU 
在 下 次 存 取 中 需要 存 取 上 次 存 取 的 第 一 个 字 的 后 续 字 ， 所 以 高 速 缓冲 存储 器 可 以 大 大 提高 处 
理 的 速度 。 

读者 可 能 会 奇怪 ， 为 什么 高 速 缓冲 存储 器 尽管 存储 容量 小 效率 却 很 高 ， 这 是 由 于 80-20 
规则 。 据 观察 ， 通 常 计算 机 花费 80% 的 时 间 来 读 取 20% 的 数据 。 换 名 话说， 相同 的 数据 
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往往 被 存 取 多 次 。 高 速 缓冲 存储 器 ， 赁 借 其 高 速 ， 可 以 存储 这 20% 的 数据 而 使 存 取 至 少 快 
80%。 


“5.4 输入 /输出 子 系统 

计算 机 中 的 第 三 个 子 系统 是 称 为 输入 /输出 (1/O ) 子 系统 的 一 系列 设备 。 这 个 子 系统 可 
以 使 计算 机 与 外 界 通信 ， 并 在 断 电 的 情况 下 存储 程序 和 数据 。 输 入 /输出 设备 可 以 分 为 两 大 
类 : 非 存储 设备 和 存储 设备 。 


5.4.1 非 存储 设备 

非 存 储 设备 使 得 CPU/ 内 存 可 以 与 外 界 通信 ， 但 它们 不 能 存储 信息 。 

1. 键盘 和 监视 器 

两 个 最 常见 的 非 存 储 输 入 /输出 设备 是 键盘 和 监视 器 。 键 盘 提 供 输 入 功能 ; 监视 器 显示 输 
出 并 同时 响应 键盘 的 输入 。 程 序 、 命 令 和 数据 的 输入 或 输出 都 是 通过 字符 串 进行 的 。 字 符 则 
是 通过 字符 集 (如 ASCII 码 ) 进行 编码 (参见 附录 A)。 此 类 中 其 他 的 设备 有 鼠标 、 操 纵 杆 等 。 

2. 打印 机 

打印 机 是 一 种 用 于 产生 永久 性 记录 的 输出 设备 。 它 是 非 存 储 设备 ， 因 为 要 打印 的 材料 不 
能 够 直接 由 打印 机 输入 计算 机 中 ， 而 且 也 不 能 再 次 利用 ， 除 非 有 人 通过 打字 或 扫描 的 方式 再 


次 输入 计算 机 中 。 


5.4.2 存储 设备 

尽管 存储 设备 被 分 为 输入 /输出 设备 ,但 它 可 以 存储 大 量 的 信息 以 备 后 用 。 它 们 要 比 主 
存 便 宜 得 多 ， 而 且 存 储 的 信息 也 不 易 丢 失 (即使 断 电信 息 也 不 会 丢失 )。 有 时 称 它们 为 辅助 
存储 设备 ， 通 常 分 为 磁 介 质 和 光 介 质 两 种 。 

1. 磁 介质 存储 设备 

磁 介 质 存 储 设备 使 用 磁性 来 存储 位 数据 。 如 果 一 点 有 磁性 则 表示 1， 如 果 没 有 磁性 则 表 
示 0。 

磁盘 

磁盘 是 由 一 张 一 张 的 磁 片 琶 加 而 成 的 。 这 些 磁 片 由 薄 磁 膜 封 装 起 来 。 信 息 是 通过 盘 上 每 
一 个 磁 片 的 读 / 写 磁头 读 写 磁 介 质 表面 来 进行 读 取 和 存储 的 。 图 5-6 给 出 了 磁盘 驱动 的 物理 
布局 和 磁盘 的 组 织 。 





扇 区 间 的 间隔 





a) 磁盘 驱动 
图 5-6 磁盘 


。 表面 结构 。 为 了 将 数据 存储 在 磁盘 的 表面 ， 每 个 盘面 都 被 划分 成 磁道 ， 每 个 磁道 又 分 
成 寿 干 个 扇 区 (图 5-6 ) 。 磁 道 之 间 通 过 磁道 间 的 间隔 隔 开 ， 扇 区 之 间 通 过 扇 区 间 的 
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间隔 隅 开 。 
。 数据 存 取 。 磁 盘 是 一 个 随机 存 取 设 备 。 在 随机 存 取 设备 中 ， 数 据 项 可 以 被 随机 存 取 ， 
而 不 需要 存 取 放置 在 其 前 的 所 有 其 他 数据 。 但 是 ， 在 某 一 时 间 可 以 读 取 的 最 小 的 存储 
区 域 只 能 是 一 个 扇 区 。 数 据 块 可 以 存储 在 一 个 或 多 个 扇 区 上 ， 而 且 该 信息 的 获取 不 需 
要 通过 读 取 磁盘 上 的 其 他 信息 。 
。 性能。 磁盘 的 性 能 取决 于 几 个 因素 : 最 重要 的 因素 是 角速度 、 寻 道 时 间 和 传送 时 间 。 
角速度 定义 了 磁盘 的 旋转 速度 。 寻 道 时 间 定 义 了 读 / 写 磁头 寻找 数据 所 在 磁道 的 时 
间 。 传 送 时 间 定 义 了 将 数据 从 磁盘 移 到 CPU/ 内 存 所 需要 的 时 间 。 
磁 市 
磁 币 大 小 不 一 。 最 普通 的 一 种 是 用 厚 磁 膜 封 装 的 半 英 寸 塑 料 磁带 。 磁 带 用 两 个 滚轮 承接 
起 来 ， 当 转动 的 磁带 通过 读 / 写 磁头 的 时 候 ， 就 可 以 通过 磁头 来 读 写 磁带 上 的 数据 。 图 5-7 
展示 了 磁带 的 机 械 构造 。 





b) 表面 结构 


图 5-7 磁带 


。 表面 结构 。 磁 带 的 宽度 可 以 分 为 9 个 磁道 ; 磁道 上 的 每 个 点 可 以 存储 1 位 的 信息 。 垂 
直 切 面 的 9 个 点 可 以 存储 8 位 ( 即 1 字 节 ) 的 信息 ， 还 有 1 位 用 作 错 误 检 测 (图 5-7 )。 
。 数据 存 取 。 和 磁带 是 顺序 存 取 设 备 。 尽 管 磁带 的 表面 可 能 会 分 成 知 干 块 ， 但 是 却 没有 寻 
址 装置 来 读 取 每 个 块 。 要 想 读 取 指 定 的 块 就 需要 按照 顺序 通过 其 前 面 所 有 的 块 。 
。 性能。 尽管 磁带 的 速度 比 磁盘 慢 ， 但 它 非常 便宜 。 现 在 ， 人 们 使 用 磁带 来 存储 大 容量 
的 数据 。 
2. 光 存 储 设备 
光 存 储 设 备 是 一 种 新 技术 ， 它 使 用 光 (激光 ) 技术 来 存储 和 读 取 数 据 。 在 发 明了 CD ( 光 
盘 ) 后 人 们 利用 光 存 储 技术 来 保存 音频 信息 。 现 在 ， 相 同 的 技术 〈 稍 做 改进 ) 被 用 于 存储 计 
算 机 上 的 信息 。 使 用 这 种 技术 的 设备 有 只 读 光 盘 (CD-ROMJ)、 可 刻录 光盘 (CD-R)、 可 重 写 
光盘 (CD-RW )、 数 字 多 功能 光盘 (DVD )。 
CD-ROM 
只 读 光盘 (CD-ROM) 使 用 与 CD (光盘 ) 相同 的 技术 (该 技术 最 初 是 由 飞利浦 和 索尼 公 
司 为 录制 音乐 而 研发 的 )。 两 者 间 唯 一 的 区 别 在 于 增强 程度 不 同 ; CD-ROM 更 健壮 ， 而 且 纠 
错 能 力 较 强 。 图 5-8 给 出 了 制造 和 使 用 CD-ROM 的 步骤 。 
。 制造 。CD-ROM 技术 需要 分 三 步 来 制造 大 量 的 光盘 : 
a. 首先 是 使 用 高 能 红外 激光 在 塑料 涂 层 上 刻写 位 模式 来 制造 主 盘 。 激 光束 使 位 模式 变 
成 一 系列 的 坑 (有 洞 ) 和 纹 间 表面 (没有 洞 ) 。 坑 通常 表示 0， 纹 间 表 面 则 通常 表示 
1。 但 这 也 只 是 一 种 规则 ， 也 可 以 反 过 来 表示 。 另 一 种 方法 是 将 过 滤 部 分 ( 坑 到 洞 
或 者 洞 到 坑 ) 表示 1， 而 非 过 渡 部 分 表示 0。 
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b. 然后 依照 主 盘 ， 做 成 相应 的 模 盘 。 在 模 盘 中 ， 坑 ( 洞 ) 则 由 凸 起 代替 。 

c. 溶解 的 聚 碳酸 酯 树脂 被 注 人 模 盘 中 以 产生 像 主 盘 中 一 样 的 坑 ， 同 时 把 一 层 非 常 薄 的 
铝 〈 作 为 一 层 反 射 表面 ) 加 到 聚 碳 酸 酯 树 化 间 。 纹 间 公 间 作 间 ”级 间 
脂 上 ， 然 后 在 反射 表面 的 上 面 还 要 加 上 一 表面 ”表面 表面 表面 。 表面 
层 保 护 漆 和 标签 。 在 制造 光盘 中 只 有 这 一 ”| 基 [ 生 生生 
步 对 于 每 一 张 光盘 都 需要 。 

读 。CD-ROM 依靠 来 自 计算 机 光驱 的 低能 

激光 束 读 信息 ， 激 光束 经 过 有 纹 间 表面 时 会 

被 铝 质 的 表 射 层 反 射 回 来 。 经 过 坑 处 时 会 被 

反射 两 次 ， 一 次 是 被 坑 的 边缘 反射 ， 另 外 一 

次 是 被 铝 质 表 射 层 的 边界 反射 ， 这 两 次 反射 

有 破坏 性 的 影响 。 因 为 坑 的 次 度 是 精确 选 定 

的 ， 为 激光 束 波 长 的 1/4。 换 言 之 ， 装 在 驱 

动 器 上 的 感应 咒 对 于 某 个 点 是 纹 间 表面 时 ， 

应 该 探测 到 多 一 些 的 光 信 号 ， 反 之 是 坑 时 就 聚 碳酸 酯 树脂 

少 一 点 ， 这 样 它 才 可 以 读 出 记录 在 原始 主 盘 

上 的 信息 。 

格式 。CD-ROM 工艺 使 用 和 磁盘 不 同 的 格 

式 (图 5-9 )。CD-ROM 的 格式 是 基于 : c) CD-ROM 

a, 使 用 汉 明 码 的 纠 错 技术 将 8 位 的 数据 块 转 图 5-8 CD-ROM 的 制造 和 使 用 
换 成 14 位 的 符号 。 | 

b, 一 个 帧 由 42 个 符号 组 成 (14 位 /符号 )。 

c. 一 个 局 区 是 由 98 个 帧 组 成 (2352 个 位 )。 

三 ] 字 节 (8 位 ) 
可 天 符号 ( 14 位 ) 


本 … 采 图 | 帧 (42 个 符号 ) 















扇 区 ( 98 帧 ) 
图 $5-9 CD-ROM 的 格式 


。 速度 。CD-ROM 驱动 器 有 不 同 的 速度 ， 单 倍速 称 为 1x，2 倍速 称 为 2x， 以 此 类 推 。 
如 果 了 驱动 妖 是 单 倍速 的 ， 它 的 读 取 速度 是 153 600 字 节 / 秒 。 表 $-2 给 出 了 不 同 的 速 
度 和 相应 的 数据 传输 速率 。 

表 5-2 CD-ROM 的 速度 
速度 数据 传输 速率 ”| ， 近似 值 


6x 921 600 字 节 / 秒 900 KB/s 4915 200 字 节 / 秒 | 4.8 MB/s 
8x 1 228 800 字 节 / 秒 | 1.2 MBA 6 144 000 字 节 / 秒 | 6MB/s 
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。 应用。 如 果 有 大 量 的 潜在 的 客户 ， 那 么 制造 主 盘 、 模 盘 和 实际 的 光盘 所 需 的 费用 是 可 


以 调节 的 。 换 言 之 ， 如 果 大 量 生产 盘 片 ， 那 么 这 项 技术 是 非常 经 济 的 。 


CD-R 

就 如 前 面 所 述 ，CD-ROM 技术 只 有 在 生产 商 大 批量 生产 时 才 合 理 。 另 一 方面 ， 可 刻录 
光盘 ( CD-R) 则 可 以 让 用 户 自己 制作 一 张 或 更 多 的 盘 片 ， 而 不 必 考 虑 像 制作 CD-ROM 时 的 
一 些 开销 。 它 非常 适合 做 备份 ， 用 户 只 需要 一 次 写 人 信息 ， 就 可 以 多 次 读 取信 息 。 这 也 是 它 
为 什么 有 时 被 称 为 “ 写 一 次 ， 读 多 次 ”(WORM) 的 原因 。 


制造 。 可 刻录 光盘 使 用 的 技术 与 制作 只 读 光盘 的 原理 相同 (图 5-10 )。 下 面 是 一 些 不 

a, 不 需要 主 盘 和 模 盘 。 二 层 

b. 反射 层 材 料 用 金 取 代 了 铝 。 全 庙 

c. 人 盘 片 聚 碳酸 酯 树脂 上 没有 坑 
( 洞 )， 盘 片上 的 坑 和 纹 间 表面 
是 模拟 出 来 的 。 为 了 模拟 坑 和 





纹 间 表 面 ， 在 聚 碳酸 酯 和 反射 激光 探测 器 激光 源 
层 之 间 额 外 添加 了 类 似 用 于 相 pe 
片 中 的 某 种 染料 。 


d. 由 刻录 机 所 产生 的 高 能 激光 束 在 染料 层 上 烧 制 次 色 的 点 (改变 化 学 组 成 )， 用 来 模 
拟 坑 ， 没 有 被 激光 所 照射 的 区 域 就 是 纹 间 表面 。 

读 。CD-R 上 的 信息 可 以 由 CD-ROM 驱动 器 和 CD-R 驱动 器 读 取 。 这 就 意味 着 任何 的 
差别 对 于 驱动 器 来 说 都 应 该 是 透明 的 。 相 同 的 低能 激光 束 经 过 模拟 的 坑 和 纹 间 表面 ， 
对 纹 间 表面 而 言 ， 激 光束 到 达 反 射 层 而 被 反射 ; 而 对 模拟 的 坑 而 言 ， 点 是 不 透明 的 ， 
所 以 激光 束 不 会 被 反射 回来 。 

格式 和 速度 。CD-R 的 格式 、 容 量 和 速度 与 CD-ROM 的 相同 。 

应 用 。 这 项 技术 对 那些 想 制作 和 发 布 少量 光盘 的 用 户 非常 有 吸引 力 ， 同 时 它 也 非常 适 
合用 于 制作 档案 文件 和 备份 。 


CD-RW 

尽管 CD-R 已 很 受 欢 迎 ， 但 它们 只 能 被 写 一 次 。 为 了 能 重 写 以 前 的 资料 ， 便 有 了 一 项 新 
的 技术 ， 利 用 该 技术 可 以 制作 一 种 称 为 可 重 写 光 盘 (CD-RW) 的 新 盘 ， 有 时 我 们 也 称 为 可 擦 
写 光 盘 。 

。 制造 。CD-RW 使 用 的 技术 与 制作 可 刻录 光盘 的 原理 相同 (图 5-11 ) 。 下 面 是 一 些 不 


同 之 处 : 

a. 该 工艺 使 用 了 银 、 铅 、 匀 和 太 标签 
的 合金 而 不 是 染料 。 这 种 合金 RD 
材料 有 两 种 稳定 的 状态 : 晶体 
态 〈 透 明 态 ) 和 无 定型 态 (不 
透明 态 )。 ( 纹 间 表 面 ) 

b. 驱动 器 使 用 高 能 激光 束 在 合金 
上 创建 模拟 的 坑 (由 晶体 态 变 “激光 探测 器 
成 无 定型 态 )。 图 5-11 制造 CD-RW 





。 读 。 驱 动 器 使 用 与 CD-ROM 和 CD-R 一 样 的 低能 激光 束 来 检测 是 坑 还 是 纹 间 表面 。 

。 擦 除 。 了 驱动 器 使 用 中 等 能 量 的 激光 束 将 坑 变 成 纹 间 表面 ， 激 光束 将 该 点 从 无 定型 态 转 
变 成 晶体 态 。 

。 格式 和 速度 。CD-RW 的 格式 、 容 量 和 速度 与 CD-ROM 的 相同 。 

。 应 用 。 这 项 技术 明显 比 CD-R 技术 更 有 了 吸引 力 。 尽 管 如 此 ，CD-R 还 是 更 受 欢迎 一 些 。 
原因 有 以 下 两 点 : 第 一 ，CD-R 空 盘 价 格 比 CD-RW 空 盘 的 价格 要 便宜 ; 第 二 ，CD-R 
在 某 些 不 容许 改变 光盘 内 容 的 场合 下 更 合适 ， 不 论 是 无 意 还 是 有 意 的 改变 。 

DVD 

工业 界 已 经 感到 了 对 更 大 存储 容量 的 数字 存储 媒介 的 需求 。CD-ROM (650 MB) 的 存 

储 容量 已 经 不 能 满足 视频 信息 存储 的 需要 。 市 场 上 最 新 的 光 存 储 设备 叫 作 数 字 多 功能 光盘 
(DVD)。 它 使 用 类 似 于 CD-ROM 的 技术 ， 但 是 又 有 以 下 的 不 同 : 

a. 坑 更 小 : 直径 只 有 0.4 微米 ， 而 CD 中 直径 为 0.8 微米 。 

b. 磁道 间 更 为 紧密 。 

c. 激光 束 用 红 激 光 代 蔡 了 红外 激光 。 ad 

d. DVD 使 用 1 一 2 个 存储 层 ， 并 且 可 以 是 单 面 或 者 
双 面 的 。 

。 容量 。 上 述 的 技术 改进 导致 了 容量 的 增 大 ( 表 5-3 )。 
。 压缩 。DVD 技术 用 MPEG (参见 第 15 章 ) 压缩 。 
这 就 意味 着 一 个 单 面 、 单 层 的 DVD 可 以 存储 133 
分 钟 (2 小 时 13 分 钟 ) 的 高 品质 视频 。 其 中 还 包 


括 音 频 和 字幕 。 
。 应 用 。 如 今 ，DVD 以 其 大 容量 应 用 于 许多 需要 存储 大 容量 数据 的 应 用 程序 中 。 


5.5 子 系 统 的 互 连 

有 前面 的 几 节 中 已 经 介绍 了 在 单个 计算 机 上 的 三 个 子 系统 ( CPU、 主 存 和 输入 /输出 ) 的 
主要 特点 。 本 节 将 介绍 它们 三 者 之 间 在 内 部 是 如 何 连接 的 ， 内 部 连接 扮演 着 很 重要 的 角色 ， 
因为 信息 需要 在 这 三 个 子 系统 中 交换 。 
5.5.1 CPU 和 存储 器 的 连接 


CPU 和 存储 器 之 间 通 常 由 称 为 总 线 的 三 组 线路 连接 在 一 起 ， 它 们 分 别 是 : 数据 总 线 、 
地 址 总 线 和 控制 总 线 (图 5-12 )。 
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图 5-12 ”使 用 三 种 总 线 连接 CPU 和 存储 器 


1. 数据 总 线 
数据 总 线 是 由 多 根 线 组 成 ， 每 一 根 线 上 每 次 传送 1 位 的 数据 。 线 的 数量 取决 于 计算 机 的 


字 的 大 小 。 例 如 ， 计 算 机 的 字 是 32 位 (4 字 节 )， 那 么 需要 有 32 根 线 的 数据 总 线 ， 以 便 同 一 
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时 刻 能 够 同时 传送 32 位 的 字 。 

2. 地 址 总 线 

地 址 总 线 允 许 访 问 存储 器 中 的 某 个 字 ， 地 址 总 线 的 线 数 取决 于 存储 空间 的 大 小 。 如 果 存 
储 右 容量 为 2" 个 字 ， 那么 地 址 总 线 一 次 需要 传送 n 位 的 地 址 数据 。 因 此 它 需要 nn 根 线 。 

3. 控制 总 线 

控制 总 线 负 责 在 中 央 处 理 器 和 内 存 之 间 传 送信 息 。 例 如 ， 必 须 有 一 个 代码 从 CPU 发 往 
内 存 ， 用 于 指定 进行 的 是 读 操 作 还 是 写 操作 。 控 制 总 线 的 线 数 取决 于 计算 机 所 需要 的 控制 命 
令 的 总 数 。 如 果 计 算 机 有 2” 条 控制 命令 ， 那 么 控制 总 线 就 需要 有 m 根 ， 因 为 m 位 可 以 定义 


2” 个 不 同 的 操作 。 


5.5.2 ”1/O 设备 的 连接 


输入 /输出 设备 不 能 够 直接 与 连接 CPU 和 内 存 的 总 线 相连 。 因 为 输入 /输出 设备 的 本 质 
与 CPU 和 内 存 的 本 质 不 同 ,输入 /输出 设备 都 是 些 机 电 、 磁 性 或 光学 设备 ， 而 CPU 和 内 存 
是 电子 设备 。 与 CPU 和 内 存 相 比 ， 输 入 /输出 设备 的 操作 速度 要 慢 得 多 。 因 此 必须 要 有 中 
介 来 处 理 这 种 差异 ， 输 入 /输出 设备 是 通过 一 种 被 称 为 输入 / 输出 控制 器 或 接口 的 器 件 连 接 
到 总 线 上 的 。 每 一 个 输入 /输出 设备 都 有 一 个 特定 的 控制 器 (图 5-13 )。 





图 5-13 IO 设备 与 总 线 的 连接 


控制 堪 
控制 莫 ， 或 者 说 接口 ， 清 除了 输入 /输出 设备 与 CPU 及 内 存在 本 质 上 的 障碍 。 控 制 器 


可 以 是 串 行 或 并 行 的 设备 。 串 行 控制 器 则 只 有 一 根 数据 线 连接 到 设备 上 ， 而 并 行 控 制 器 则 有 
数 根 数据 线 连 接 到 设备 上 ， 使 得 一 次 能 同时 传送 多 个 位 。 

有 几 种 控制 器 至 今 还 在 使 用 ， 如 今 最 常用 的 有 SCSI、 火 线 、USB 和 HDMI。 

SCS| 

小 型 计算 机 系统 接口 (SCSI) 最 初 是 1984 年 为 Macintosh 计算 机 而 设计 的 。 今 天 还 有 
许多 系统 使 用 它 。 它 是 一 个 8、16 或 32 线 的 并 行 接口 。SCSI 接口 如 图 5-14 所 示 ， 它 提供 了 
菊花 链 连 接 ， 连 接 链 的 两 端 都 必须 有 终结 器 ， 并 且 每 个 设备 都 必须 要 有 唯一 的 地 址 (目标 ID )。 

火线 

IEEE 标准 1394 规定 的 串 行 接口 ， 俗 称 为 火线 。 它 是 一 种 高 速 的 串 行 接口 ， 数 据 采 用 数 
据 包 的 形式 传送 ， 数 据 的 传输 速度 高 达 50 MB/s， 然 而 对 于 版 本 最 新 的 数据 线 ， 这 个 速度 可 
以 翻 一 倍 。 它 可 以 在 一 条 菊花 链 或 树 形 连 接 (只 用 一 根 线 ) 上 连接 多 达 63 个 设备 。 图 5-15 
给 出 了 输入 /输出 设备 和 火线 控制 器 的 连接 。 和 SCSI 相 比 ， 它 不 需要 终结 器 。 
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磁盘 CD-ROM 扫描 仪 磁带 
图 5-14 SCSI 控制 器 





USB 
通用 串 行 总 线 (USB) 控制 做 是 一 种 可 以 和 火线 控制 器 相 媲 美的 控制 问 。 虽 然 术语 使 


用 了 词 bus， 但 USB 是 一 种 串 行 控制 器 ， 用 以 连接 与 计算 机 相连 的 一 些 低速 和 高 速 设备 。 
5-16 显示 了 USB 控制 天 导 总 线 间 的 连接 和 设备 与 控制 器 间 的 连接 。 


CPU 


USB 控 制 锋 
( 根 集线器 ) 





:设备 


图 5-16 USB 控制 器 
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多 个 设备 可 以 被 连接 到 一 个 USB 控制 器 上 ， 这 个 控制 器 也 称 为 根 集线器 。USB-2 (USB 
版 本 2.0 ) 允许 多 达 127 个 设备 组 成 树 状 拓扑 结构 连接 到 一 个 USB 控制 器 上 ， 其 中 控制 器 作 
为 树 的 根 ， 集 线 器 作为 中 间 节 点 ， 设 备 作 为 末端 节点 。 控 制 器 ( 根 集线器 ) 与 其 他 集线器 的 
不 同 之 处 在 于 控制 器 能 感知 到 树 中 其 他 集线器 的 存在 ， 而 其 他 集线器 是 被 动 的 设备 ， 它 们 只 
是 简单 地 传送 数据 。 

设备 可 以 不 需要 关闭 计算 机 很 容易 地 被 移 除 或 连接 到 树 中 。 这 称 为 热 交 换 。 当 集线器 被 
从 系统 中 移 除 时 ， 与 此 集线器 相连 的 所 有 设备 和 其 他 集线器 也 被 移 除 。 

USB 使 用 4 根 线 的 电缆 。 两 根 线 (+5V 和 地 ) 被 用 来 为 像 键盘 和 鼠标 这 样 的 低压 设备 提 
供电 压 。 高 压 设备 需要 被 连接 到 电源 上 。 集 线 器 从 总 线 取得 电压 ， 能 为 低压 设备 提供 电压 。 
其 他 两 根 线 (缠绕 在 一 起 ， 以 减 小 噪声 ) 用 来 传送 数据 、 地 址 和 控制 信号 。USB 使 用 两 种 不 
同 的 连接 头 : A 和 也 。 连 接头 A (下 游 连 接 器 ) 是 矩形 的 ， 用 来 连接 到 USB 控制 器 或 集线器 。 
连接 头 B (上 游 连接 器 ) 是 接近 正方 形 的 ， 用 来 连接 到 设备 。 最 近 两 种 新 型 连接 器 (微型 A 
和 微型 B) 已 经 被 引入 ， 用 来 连接 小 设备 和 笔记 本 。 

USB-2 提供 三 种 传送 速率 : 1.5 Mbps (每 秒 兆 位 )、12 Mbps 和 480 Mbps。 低 速率 可 以 
用 于 低速 设备 ， 如 键盘 和 鼠标 ; 中 速率 用 于 打印 机 ; 高 速率 用 于 大 容量 的 存储 设备 。 

通过 USB 的 数据 是 以 包 (参见 第 6 章 ) 的 形式 传输 的 。 每 个 包含 有 : 地 址 部 分 (设备 标 
识 )、 控 制 部 分 、 要 被 传送 到 其 他 设备 的 数据 部 分 。 所 有 设备 将 接收 到 相同 的 包 ， 但 只 有 具 
有 数据 包 中 所 定义 的 地 址 的 那些 设备 将 接受 它 。 

USB 3.0 是 计算 机 连接 方 对 通用 串 行 总 线 ( USB) 标准 的 再 一 次 修订 。USB 3.0 增加 了 
一 个 新 的 叫 作 “SuperSpeed”( 超 感 ) 的 传输 模式 ， 这 个 模式 可 以 将 数据 传输 的 速率 提升 至 
4.8 Gbps。 根 据 承 诺 ，USB 3.0 的 速率 将 更 新 至 10 Gbps。 

HDMI 

高 清晰 度 多 媒体 接口 ( HDMI) 是 现 有 视频 模拟 标准 的 数字 化 替代 品 。 它 可 以 用 来 从 一 
个 资源 向 另 一 个 兼容 的 计算 机 显示 器 、 视 频 投影 仪 、 数 字 电 视 或 数字 音像 设备 传输 视频 数据 
和 数字 音像 数据 。 现 有 的 多 种 HDMI 标准 电缆 可 用 于 传输 包括 标准 、 加 强 、 高 清晰 以 及 3D 
画 质 的 视频 数据 ， 最 多 可 达 8 频道 的 压缩 或 未 压缩 数字 音频 ， 消 费 性 电子 控制 (CEC) 连接 ， 
并 且 可 用 于 以 太 网 络 数据 连接 。 


5.5.3 输入 /输出 设备 的 寻 址 


通常 CPU 使 用 相同 的 总 线 在 主 存 和 输入 /输出 设备 之 间 读 写 数据 。 唯 一 的 不 同 是 指令 。 
如 果 指 令 涉 及 主 存 中 的 字 ， 那 么 数据 会 在 主 存 和 CPU 之 间 传 送 。 如 果 指 令 涉 及 输入 /输出 
设备 ， 那么 数据 会 在 输入 /输出 设备 和 CPU 之 间 传 送 。 有 两 种 方法 用 来 对 输入 /输出 设备 进 
行 寻 址 ， 即 IO 独立 寻 址 和 IO 存储 器 映射 寻 址 。 

1. 1/0 独立 寻 址 

在 I/O 独立 寻 址 中 ， 用 来 读 / 写 内 存 的 指令 与 用 来 读 / 写 输入 /输出 设备 的 指令 是 完全 不 
同 的 。 有 专门 的 指令 完成 对 输入 /输出 设备 的 测试 、 控 制 以 及 读 写 操作 。 每 个 输入 /输出 设备 
有 自己 的 地 址 。 因 为 指令 的 不 同 ， 所 以 输入 /输出 地 址 可 以 和 内 存 地 址 重叠 而 不 会 产生 泥 清 。 
例如 ，CPU 可 以 使 用 读 命令 'Read 101' 来 从 内 存 中 读 取 字 101。 它 也 可 以 使 用 输入 命令 Input 
101' 来 从 地 址 端口 为 101 的 输入 /输出 设备 中 读 取 数 据 。 这 里 不 会 发 生 混淆 ， 因 为 Read 指令 
是 规定 从 内 存 中 读 取 数 据 ， 而 Input 指令 则 是 规定 从 输入 /输出 设备 中 读 取 数 据 (图 5-17 )。 
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2. IO 存储 堪 映 射 寻 址 
在 MO 存储 器 映射 寻 址 方式 中 ，CPU 将 输入 /输出 控制 器 中 的 每 一 个 寄存 器 都 看 作 内 存 


中 的 某 个 存储 字 。 换 言 之 ，CPU 没有 单独 的 指令 用 来 表示 是 从 内 存 或 是 从 输入 /输出 设备 传 
送 数据 。 例 如 , 在 指令 集中 只 有 一 条 'Read' 指令 ， 如 果 地 址 指定 的 是 内 存 中 的 某 个 单元 ， 则 
从 内 存 中 读 取 数据 。 如 果 地 址 指定 的 是 输入 /输出 设备 中 的 某 个 寄存 器 ， 那 么 就 从 寄存 器 中 
读 取 数据 。 存 储 器 映射 的 输入 /输出 的 配置 优点 在 于 有 一 个 较 小 的 指令 集 ， 所 有 对 内 存 的 操 
作 指 令 都 同样 适合 于 输入 /输出 设备 ， 其 缺点 是 输入 /输出 控制 器 占用 了 一 部 分 内 存 地 址 。 
例如 ， 假 使 有 5 个 输入 /输出 控制 器 ， 每 个 控制 器 有 4 个 寄存 器 ， 则 共 占 用 20 个 地 址 。 相 
应 的 内 存 的 大 小 就 减 小 了 20 个 字 。 图 5-18 给 出 了 IO 存储 器 映射 的 概念 。 





图 5-18 IO 存储 器 映射 寻 址 


5.6 ”程序 执行 
当今 ， 通 用 计算 机 使 用 称 为 程序 的 一 系列 指令 来 处 理 数据 。 计 算 机 通过 执行 程序 ， 将 输 
入 数据 转换 成 输出 数据 。 程 序 和 数据 都 放 在 内 存 中 。 


本 章 最 后 将 给 出 假想 简单 计算 机 执行 程序 的 几 个 例子 。 


5.6.1 机 器 周期 
CPU 利用 重复 的 机 器 周期 来 执行 程序 中 的 指令 ， 一步 一 条 ， 从 开始 到 结束 。 一 个 简化 


计 琅 机 组 成 





的 周期 包括 3 步 : 取 指 令 、 译 码 和 执行 (图 5-19 )。 





图 5-19 ”机 器 周期 的 步骤 


1. 取 指 令 
在 取 指 令 阶 段 ， 控 制 单元 命令 系统 将 下 一 条 将 要 执行 的 指令 复制 到 CPU 的 指令 寄存 器 


中 。 被 复制 的 指令 地 址 保存 在 程序 计数 器 中 。 复 制 完 成 后 ， 程 序 计数 器 自动 加 1 指向 内 存 中 
的 下 一 条 指令 。 

2. 译 码 

机 融 周 期 的 第 二 阶段 是 译 码 阶 段 。 当 指令 置 于 指令 寄存 器 后 ， 该 指令 将 由 控制 单元 负责 
译 码 。 指 令 译 码 的 结果 是 产生 一 系列 系统 可 以 执行 的 二 进 制 代码 。 

3. 执行 

指令 译 码 完毕 后 ， 控 制 单元 发 送 任务 命令 到 CPU 的 某 个 部 件 ， 例 如 ， 控 制 单元 告知 系 
统 ， 让 它 从 内 存 中 加 载 ( 读 ) 数据 项 ， 或 者 是 CPU 让 算术 逻辑 单元 将 两 个 输入 寄存 器 中 的 内 
容 相 加 并 将 结果 保存 在 输出 寄存 器 。 这 就 是 执行 阶段 。 


5.6.2 输入 /输出 操作 


计算 机 需要 通过 命令 把 数据 从 IO 设备 传输 到 CPU 和 内 存 。 因 为 输入 /输出 设备 的 运 
行 速度 比 CPU 慢 得 多 ， 因 此 CPU 的 操作 在 某 种 程度 上 必须 和 输入 /输出 设备 同步 。 有 三 种 
方法 被 设计 用 于 同步 ， 分 别 为 : 程序 控制 输入 / 
输出 、 中 断 控制 输入 /输出 、 直 接 存储 器 存 取 
(DMA )。 

1. 程序 控制 输入 / 输出 

在 程序 控制 输入 /输出 中 ， 采 用 最 简单 的 
一 种 同步 : CPU 等待 IO 设备 (图 5-20 )。 

CPU 和 LO 设备 之 间 的 数据 传输 是 通过 程 
序 中 的 指令 实现 的 。 当 CPU 遇 到 一 条 IO 指令 
时 ， 它 就 停止 工作 直到 数据 传输 完毕 。CPU 不 
时 地 查询 IO 设备 的 状态 : 如 果 设 备 做 好 了 传 
输 准 备 ， 那 么 数据 将 被 传送 到 CPU ; 如 果 设 备 
没有 做 好 传输 准备 ， 那 么 CPU 将 继续 查询 IO 
设备 的 状态 直到 IO 设备 准备 好 为 止 。 这 种 方 
法 存在 的 最 大 问题 就 是 ， 当 每 一 个 单元 数据 被 
传输 时 ，CPU 都 要 浪费 时 间 去 查询 IO 的 状态 。 图 5-20 程序 控制 输入 /输出 
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要 注意 的 是 ， 数 据 在 输入 操作 后 被 传送 到 内 存 ， 在 输出 操作 前 则 是 从 内 存 中 取出 。 


2. 中 断 控 制 输入 /输出 
在 中 断 控 制 输入 /输出 中 ， 首 先 CPU 告知 IO 设备 即将 开始 传输 ， 但 是 CPU 并 不 需要 


不 停 地 查询 IO 设备 的 状态 。 当 1/0 设备 准备 好 时 ， 它 通知 (中 断 ) CPU。 在 这 过 程 中 ，CPU 
还 可 以 做 其 他 工作 。 例 如 ， 运 行 其 他 程序 ， 从 其 他 的 IO 设备 读 入 或 传 出 数据 〈 图 5-21 )。 

在 这 种 方法 中 ，CPU 时 间 没 有 被 浪费 。 当 慢 速 的 IO 设备 正在 完成 一 项 任务 时 ，CPU 
可 以 做 其 他 工作 。 注 意 ， 像 程序 控制 输入 /输出 一 样 ， 这 种 方法 也 在 IO 设备 和 CPU 之 间 传 
输 数据 。 数 据 在 输入 操作 后 被 传送 到 内 存 ， 在 输出 操作 前 则 是 从 内 存 中 取出 。 
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图 5-21 中 断 控制 输入 /输出 


3. 直接 存储 器 存 取 
第 三 种 传输 数据 的 方法 是 直接 存储 器 存 取 (DMA )。 这 种 方法 用 于 在 高 速 IO 设备 间 


传输 大 量 的 数据 块 ， 例 如 磁盘 、 内 存 (不 需要 通过 CPU 的 数据 传输 )。 这 种 方法 需要 一 个 
DMA 控制 器 来 承担 CPU 的 一 些 功能 。DMA 控制 器 中 有 寄存 器 ， 可 以 在 内 存 传 输 前 后 保存 
数据 块 。 图 5-22 给 出 了 DMA 与 数据 、 地 址 和 控制 总 线 的 连接 情况 。 


CPU 


数据 块 传输 (5) 





图 5-22 DMA 和 一 般 总 线 的 连接 


矿 斧 帮 绍 成 


在 使 用 这 种 方法 进行 IO 操作 时 ，CPU 发 送 消息 给 DMA。 这 些 消息 包括 传输 类 型 ( 输 
入 或 输出 )、 内 存单 元 的 起 始 地 址 以 及 传输 的 字 节 TE 
数 。 之 后 CPU 就 可 做 其 他 的 工作 (图 5-23 )。 

当 准 备 好 传输 数据 时 ， 则 由 DMA 控制 器 通知 
CPU 它 需 要 获得 总 线 的 使 用 权 。 这 时 CPU 停止 使 
用 总 线 并 转交 给 DMA 控制 器 使 用 。 在 内 存 和 DMA 
间 的 数据 传输 完成 后 ，CPU 继续 进行 正常 操作 。 需 
要 注意 的 是 ， 在 这 种 方法 中 ，CPU 只 是 在 一 小 段 时 
间 内 是 空闲 的 。CPU 仅 当 在 DMA 和 内 存 间 传输 数 
据 时 才 空 闲 ， 而 不 是 在 设备 为 传输 数据 做 准备 时 。 


5.7 不 同 的 体系 结构 


在 最 近 几 十 年 中 ， 计算机 的 体系 结构 和 组 织 售 上 全 ) | 
经 历 了 许多 变化 。 本 书 将 讨论 一 些 与 我 们 前 面 讨论 图。 DMA 给 信和 给 册 
的 简单 计算 机 体系 结构 所 不 同 的 常见 的 体系 结构 和 
组 织 。 


5./.1 CISC 


CISC ( 读 作 [sisk]) 是 复杂 指令 集 计 算 机 ( complex instruction set computer) 的 缩写 。 
CISC 体系 结构 的 设计 策略 是 使 用 大 量 的 指令 ， 包 括 复杂 指令 。 和 其 他 设计 相 比 ， 在 CISC 
中 进行 程序 设计 要 比 在 其 他 设计 中 容易 得 多 ， 因 为 每 一 项 简单 或 复杂 的 任务 都 有 一 条 对 应 的 
指令 。 程 序 员 不 需要 写 一 大 堆 指 令 去 完成 一 项 复杂 的 任务 。 

指令 集 的 复杂 性 使 得 CPU 和 控制 单元 的 电路 非常 复杂 。CISC 体系 结构 的 设计 者 已 经 
提出 减少 这 种 复杂 性 的 解决 方案 : 程序 在 两 个 层面 上 运行 。CPU 不 直接 执行 机 器 语言 指令 。 
CPU 只 执行 被 称 为 微 操 作 的 简单 操作 。 复 杂 指 令 被 转化 为 一 系列 简单 操作 然后 由 CPU 执 
行 。 这 种 执行 机 制 需 要 一 个 被 称 为 微 内 存 的 特殊 内 存 ， 它 负责 保存 指令 集中 的 每 个 复杂 指令 
的 一 系列 操作 。 使 用 微 操 作 的 程序 设计 被 称 为 微 程序 设计 。 

反对 CISC 体系 结构 的 一 个 理由 便 是 微 程序 设计 和 存 取 微 内 存 所 带 来 的 开销 。 然 而 ， 这 
种 体系 结构 的 支持 者 则 认为 这 使 得 程序 在 机 器 层 上 的 程序 更 简洁 。CISC 体系 结构 的 一 个 例 
子 便 是 英特尔 公司 所 开发 的 奔腾 系列 处 理 器 。 





5.7.2 RISC 

RISC ( 读 作 [risk]) 是 精简 指令 集 计 算 机 ( reduce instruction set computer) 的 缩写 。RISC 
体系 结构 的 设计 策略 是 使 用 少量 的 指令 完成 最 少 的 简单 操作 。 复 杂 指 令 用 简单 指令 子 集 模拟 。 
在 RISC 中 进行 程序 设计 比 在 其 他 设计 中 更 难 、 更 费时 ， 因 为 复杂 指令 都 用 简单 指令 来 模拟 。 


5.7.3 流水 线 

我 们 已 经 学 过 计算 机 对 于 每 条 指令 使 用 取 指 令 、 译 码 和 执行 三 个 阶段 。 在 早期 计算 机 
中 ,每 条 指令 的 这 三 个 阶段 需要 串 行 完成 。 换 言 之 ， 指 令 n 需要 在 指令 n+l 开始 它 的 阶段 
之 前 完成 它 的 所 有 阶段 。 现 代 计算 机 使 用 称 为 流水 线 的 技术 来 改善 吞吐 量 (在 单位 时 间 内 完 


成 的 指令 总 数 )。 这 个 理念 是 如 果 控 制 单元 能 同时 执行 两 个 或 三 个 阶段 ， 那 么 下 一 条 指令 就 
可 以 在 前 一 条 指令 完成 前 开始 。 图 5-24a 显示 了 三 条 连续 的 指令 不 使 用 流水 线 时 是 如 何 处 理 
的 ， 图 5-24b 显示 了 通过 允许 属于 不 同 指令 的 不 同 阶段 同时 执行 ， 流 水 线 是 如 何 提高 计算 机 
的 吞吐 量 的 。 换 言 之 ， 当 计算 机 在 执行 第 一 条 指令 的 译 码 阶段 时 ， 它 还 能 执行 第 二 条 指令 的 
取 指令 阶段 。 第 一 台 计 算 机 在 指定 时 间 内 平均 执行 9 个 阶段 ， 而 流水 线 计算 机 在 相同 的 时 间 
内 能 执行 24 个 阶段 。 如 果 假 定 每 个 阶段 使 用 相同 的 时 间 ， 那 第 一 台 计 算 机 完成 9/3=3 条 指 
令 ， 而 第 二 台 计 算 机 完成 了 24/3=8 条 指令 。 因 此 吞吐 量 提高 了 8/3 或 266%。 

当然 ， 流 水 线 并 不 像 这 样 简 单 。 当 遇 到 转移 指令 时 ， 就 会 出 现 一 些 问 题 。 在 这 种 情况 
下 ， 在 管道 中 的 指令 应 该 被 丢弃 。 但 是 ， 新 的 CPU 的 设计 已 经 克服 了 大 部 分 缺点 ， 有 些 新 
的 CPU 设计 甚至 能 同时 进行 多 个 取 指 令 周 期 。 


[FE。 


a) 不 使 用 流水 线 


b) 使 用 流水 线 
图 5-24 流水 线 
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5.7.4 并行 处 理 


计算 机 传统 上 有 单个 控制 单元 、 单 个 算术 逻辑 单元 、 单 个 内 存单 元 。 随 着 技术 的 进步 和 
计算 机 硬件 成 本 的 下 降 ， 如 今 可 以 拥有 具有 多 个 控制 单元 、 多 个 算术 逻辑 单元 和 多 个 内 存单 
元 的 计算 机 。 这 个 思想 称 为 并 行 处 理 。 像 流水 线 一 样 ， 并 行 处 理 能 改善 知 叶 量 。 
ge dda 

M. J. Flynn 拓 ! 给 山 | 的 。 
SIMD _ 
法 把 计算 机 的 组 织 (从 数据 处 理 来 看 ) 分 成 4 类 ， 正 如 
图 5-25 所 示 。 按 照 Flynn 的 观点 ， 并 行 处 理 可 能 发 生 
在 数据 流 、 指 令 流 或 两 者 都 有 。 多 指令 访 多 数据 村 

1. SISD 组 织 图 5-25 计算 机 组 织 的 分 类 

单 指令 流 单数 据 流 ( SISD) 组 织 表示 计算 机 有 一 个 控制 单元 、 一 个 算术 逻辑 单元 和 一 个 
内 存单 元 。 指 令 被 顺序 执行 ， 每 条 指令 可 以 存 取 数据 流 中 的 一 个 或 多 个 数据 项 。 本 章 前 面 介 
绍 的 简单 计算 机 就 是 SISD 组 织 的 例子 。 图 5-26 显示 了 SISD 组 织 的 配置 概念 。 













Load R 40 
LoadR 50 


指令 流 






a) 概念 b) 配置 
图 5-26 SISD 组 织 
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2. SIMD 组 织 
单 指令 流 多 数据 流 ( SIMD) 组 织 表 示 计 算 机 有 一 个 控制 单元 、 多 个 处 理 单元 和 一 个 内 
存单 元 。 所 有 处 理 器 单元 从 控制 单元 接收 相同 的 指令 ， 但 在 不 同 的 数据 项 上 操作 。 同 时 操作 
于 一 阵列 数据 的 处 理 器 阵列 就 是 属于 这 一 类 的 。 图 5-27 显示 了 SIMD 组 织 的 概念 和 实现 。 
ALU:; 算术 逻辑 单元 


CU: 控制 单元 





a) 概念 b) 实现 
图 $-27 SIMD 组织 


3. MISD 组 织 

多 指令 流 单数 据 流 (MISD) 体系 结构 是 属于 多 个 指令 流 的 多 个 指令 作用 于 相同 的 数据 
项 的 体系 结构 。 图 5-28 显示 了 这 个 概念 ， 但 它 从 来 就 未 
被 实现 。 

4. MIMD 组 织 TCR 

多 指令 流 多 数据 流 (MIMD) 体系 结构 是 属于 多 个 指 [LRi8l 
令 流 的 多 个 指令 作用 于 多 个 数据 流 (每 条 指令 作用 于 一 [Load Rad2 
个 数据 项 )。 图 5-29 显示 了 概念 和 实现 。 一 些 专家 认为 
MIMD 组 织 是 真正 的 并 行 处 理 体系 结构 。 在 这 种 体系 结 图 5-28 MISD 组 织 
构 中 ， 可 以 同时 执行 多 个 任务 。 这 个 体系 结构 可 以 使 用 
单个 的 共享 内 存 或 多 个 内 存 区 。 

并 行 处 理 有 多 种 用 途 ， 大 多 用 于 科学 团体 ， 它 们 的 任务 如 果 使 用 传统 的 计算 机 体系 结构 
可 能 需要 几 个 小 时 或 几 天 。 这 些 例子 有 : 大 矩阵 的 相 乘 、 天 气 预 报 的 大 量 数据 的 同时 处 理 或 
空间 的 飞行 模拟 。 








5.8 简单 计算 机 
为 了 解释 计算 机 的 体系 结构 ， 还 有 它们 的 指令 处 理 ， 我 们 引入 一 台 简单 ( 非 真 实 的 ) 计 
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算 机 ， 如 图 5-30 所 示 。 简 单 计 算 机 有 三 个 组 成 部 分 : CPU、 存 储 器 和 输入 /输出 子 系统 。 


内 容 ” 地 址 
CPU (16 位 ) (8 位 ) 






程序 


FF: 监视 器 地 址 
PC; 程序 计数 器 
IR: 指令 寄存 器 
R; 寄存 器 


输入 /输出 设备 
图 5-30 ”简单 计算 机 的 组 成 


5.8.1 CPU 
CPU 本 刁 被 分 成 三 部 分 : 数据 寄存 器 、 算 术 逻 辑 单元 (ALU) 和 控制 单元 。 


1. 数据 寄存 器 

计算 机 中 有 16 个 16 位 的 数据 寄存 器 ， 它 们 的 十 六 进 制 地 址 为 (0, 1, 2,…, F)is， 但 我 们 
称 它们 为 Re 到 Ris。 在 大 多 数 指令 中 ， 它 们 含有 16 位 数据 ， 但 在 有 些 指 令 中 ， 它 们 可 能 含 
有 其 他 信息 。 


2. 控制 单元 
控制 单元 具有 电路 ， 控 制 ALU 的 操作 、 对 内 存 的 存 取 和 对 1/0 子 系统 的 存 取 。 它 有 两 


个 专用 的 寄存 器 : 程序 计数 器 和 指令 寄存 器 。 程 序 计数 器 (PC) (只 含有 8 位 ) 保存 的 是 下 一 
条 将 被 执行 的 指令 的 踪迹 。PC 的 内 容 指 向 含有 下 一 条 程序 指令 的 主 存 的 存储 单元 的 地 址 。 
在 每 个 机 器 周期 后 ， 程 序 计数器 将 加 1， 指 向 下 一 条 程序 指令 。 指 令 寄存 器 (IR) 含有 16 位 


值 ， 它 是 当前 周期 译 码 的 指令 。 


5.8.2 主 存 


主 存 有 256 个 16 位 的 存储 单元 ， 二进制 的 地 址 为 (00000000); 到 (11111101):， 或 者 是 
十 六 进 制 的 (00)ie 到 (FD)io。 主 存 中 既 有 数据 ， 又 有 程序 指令 。 前 64 个 存储 单元 (00)1ie 到 
(3F)ie 被 专用 于 程序 指令 。 任 何 程 序 的 程序 指令 存储 在 连续 的 内 存单 元 中 ， 存 储 单 元 (40)1s 


到 (FD)is 被 用 来 存储 数据 。 


5.8.3 输入 /输出 子 系统 
简单 计算 机 有 一 个 非常 原始 的 输入 /输出 子 系统 。 子 系统 由 一 个 键盘 和 一 台 监 视 器 组 
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成 。 虽然 在 图 5-30 中 用 分 开 的 盒子 表示 键盘 和 监视 器 ， 但 子 系统 是 内 存 地 址 方式 的 一 部 分 。 
这 些 设备 有 内 存 映 射 地 址 ， 正 如 本 章 前 面 讨论 的 。 假 定 键 盘 (作为 输入 设备 ) 和 监视 器 (只 
作为 输出 设备 ) 像 内 存单 元 一 样 ， 它 们 的 地 址 分 别 为 (FE)is 和 (FF)ie， 正 如 图 中 所 示 。 换 言 
之 ,假定 它们 就 像 16 位 的 寄存 器 ， 作 为 内 存单 元 与 CPU 进行 交互 。 这 两 个 设备 把 数据 从 外 
界 传输 到 CPU， 反 之 亦 然 。 


5.8.4 指令 集 

简单 计算 机 具有 16 条 指令 集合 的 能 力 ， 虽 然 我 们 只 使 用 这 些 指令 中 的 14 条。 每 条 计 
算 机 指令 由 两 部 分 构成 : 操作 码 ( opcode) 和 操作 数 ( operand)。 操 作 码 指明 了 在 操作 数 上 
执行 的 操作 的 类 型 。 每 条 指令 由 16 位 组 成 ， 被 分 成 4 个 4 位 的 域 。 最 左边 的 域 含有 操作 码 ， 
其 他 3 个 域 含有 操作 数 或 操作 数 的 地 址 ， 如 图 5-31 所 示 。 







RE 关 内存 地 址 ”| 寄存 器 地 址 






b) 指令 类 型 
图 5-31 格式 和 不 同 指 令 类 型 


指令 列 在 表 5-4 中 。 注 意 ， 并 不 是 每 条 指令 都 需要 3 个 操作 数 。 任 何不 需要 的 操作 数 域 
被 填 以 (0)1ie。 例 如 ， 停 机 指令 的 所 有 3 个 操作 数 域 、 传 送 指令 和 NOT 指令 的 最 后 一 个 域 都 
害 填 以 (0)is。 还 要 注意 ， 寄 存 器 地 址 是 用 单个 十 六 进 制 数 来 表示 的 ， 所 以 只 用 一 个 域 ， 而 内 
存单 元 是 用 两 个 十 六 进 制 数 来 表示 ， 所 以 用 两 个 域 。 

表 5-4 简单 计算 机 的 指令 表 


动作 


mr | oo | | | | 
own | 1 | | Ww | 

oon | : | mH | | | 

or | 1 | wm | em | | 

vor | so | w | | | 

op | 7 | wm | wm | | wri 
ox | | | wm | we [or 


( 续 ) 


TT 一 


xoR | 9 | Rw | Rs | Re | RR XORRe 
me | A | rn | | [re 
psc | s | r | | [re-i 
mm | D | R | ， | | 如 果 RuxR 于 人 PC 厅 风 下 


Rs、Rs!、Rs;: 源 寄存 器 的 十 六 进 制 地 址 

Ro: 目的 寄存 器 的 十 六 进 制 地 址 

Ms: 源 内 存单 元 的 十 六 进 制 地 址 

Mop: 目的 内 存单 元 的 十 六 进 制 地 址 

n: 十 六 进 制 数 

di、d2、d;、d4: 第 一 、 二 、 三 、 四 个 十 六 进 制 数 


加 法 指令 有 两 条 : 一 条 用 作 整 数 的 相 加 (ADDI)， 一 条 用 作 浮 点 数 的 相 加 (ADDF )。 如 果 
使 用 地 址 (FE)i 作为 LOAD 指令 的 第 二 个 操作 数 ， 简 单 计算 机 就 可 以 从 键盘 取得 输入 。 同 样 ， 
如 果 使 用 地 址 (FF)is 作为 STORE 指令 的 第 二 个 操作 数 ， 计 算 机 就 可 以 发 送 输出 到 监视 器 。 如 
果 ROTATE 指令 的 第 三 个 操作 数 是 0， 那 么 指令 就 把 R 中 的 二 进 制 位 模式 向 右 循环 移 位 n 个 
位 置 如 果 第 三 个 操作 数 是 1， 则 癌 左 循环 移 位 。 此 外 还 有 加 1 (INC) 和 减 1 (DEC) 指令 。 


5.8.5 ”处 理 指令 


像 大 多 数 计算 机 一 样 ， 简 单 计算 机 使 用 机 器 周期 。 一 个 周期 有 三 个 阶段 ， 取 指令 、 译 
码 和 执行 。 在 取 指 令 阶 段 ， 其 地 址 由 PC 决定 的 指令 从 内 存 中 得 到 ， 被 装 入 IR 中 。 然 后 PC 
加 1， 指向 下 一 条 指令 。 在 译 码 阶段 ，IR 中 的 指令 被 译 码 ， 所 需 的 操作 数 从 寄存 器 或 内 存 
中 取 到 。 在 执行 阶段 ， 指 令 被 执行 ， 结 果 被 放 人 合适 的 内 存单 元 或 寄存 器 中 。 一 旦 第 三 阶段 
结束 ， 控 制 单元 又 开始 新 的 周期 ， 现 在 PC 是 指向 下 一 条 指令 的 。 处 理 过 程 一 直 继 续 ， 直 到 
CPU 遇 到 HALT 指令 。 

一 个 例子 

让 我 们 显示 简单 计算 机 是 如 何 进行 整数 A 和 了 B 的 相 加 的 ， 创 建 的 结果 为 C。 假 定 整数 
是 二 进 制 补 码 格式 。 在 数学 上 ， 这 个 操作 表示 为 ; 

C=A+B 

为 了 用 简单 计算 机 解决 这 个 问题 ， 有 必要 把 前 面 两 个 整数 存放 在 寄存 器 中 (例如 Ro 和 
Ri )。 操 作 的 结果 存放 在 第 三 个 寄存 器 中 (例如 Ra )。ALU 只 能 操作 那些 存储 在 CPU 数据 寄存 
器 中 的 数据 。 但 是 ， 大 多 数 计算 机 (包括 简单 的 计算 机 ) 在 CPU 中 只 有 有 限 的 寄存 器 。 如 果 
数据 项 的 数量 很 大 ， 并 且 它 们 在 程序 执行 过 程 中 应 该 保留 在 计算 机 中 ， 比 较 好 的 方法 是 把 它们 
存储 在 内 存 中 ， 临 时 地 把 它们 调和 人 寄存 器 中 。 这 样 我 们 假定 前 两 个 整数 存储 在 内 存单 元 (40)ie 
和 (41)is。 结 果 应 该 被 存储 在 内 存单 元 (42)ie 中 。 这 就 意味 着 两 个 整数 需要 被 调和 人 CPU 中 ， 
结果 需要 被 存储 在 内 存 中 。 因 此 ， asiaiiaiaiiiniiiana 有 显示 如 下 : 


1) 把 内 存 Mu 的 内 容 装 人 寄存 器 Ri (Ro < Mo)。 和 es. 沪 记 i ee 
-2 ) 把 内 存 Ms 的 内 容 装 入 寄存 器 RR; (Ri 一 Me)。 es en Le 
“3) 相 加 Ro 和 Ri 的 内 容 ， 结 果 放 人 Ra 中 (Rs 一 Ro +R 和 eed. 
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4) 把 R: 的 内 容 存 入 Ma2 中 (M; 二 了 > 这 
5) 停机 。 
在 简单 计算 机 的 语言 中 ， 这 5 条 指令 被 译 码 为 : 
代 码 解 释 


5.8.6 存储 程序 和 数据 


为 了 遵循 汉 “' 诺 依 曼 模型 ， 我 们 需要 把 程序 和 数据 存储 在 内 存 中 ， 可 以 从 内 存单 元 (00)r 
到 (04)ie 存储 5 行程 序 。 我 们 已 经 知道 数据 也 需要 被 存储 在 内 存单 元 (40)ie、(41)ie 和 (42)i6 中 。 


5.8.7 ”指令 周期 

计算 机 每 条 指令 使 用 一 个 指令 周期 。 如 果 有 5 条 指令 的 小 程序 ， 那 么 需要 5 个 指令 周 
期 。 每 个 周期 通常 由 三 个 步骤 组 成 : 取 指 令 、 译 码 、 执 行 。 现 在 假定 需要 相 加 161 + 254 = 
415。 这 些 数 据 在 内 存 中 用 十 六 进 制 表示 为 : (00Al)ik、(00FE)ie 和 (019F)ie。 

1. 周期 1 

在 第 一 周期 开始 时 (图 5-32 )，PC 指向 程序 的 第 一 条 指令 ， 它 在 内 存单 元 (00)ik 中 。 控 

1 ) 控制 单元 取出 存储 在 内 存单 元 (00)ik 中 的 指令 ， 放 人 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指令 (1040)i6 为 Re 一 Mso; 

3 ) 控制 单元 执行 指令 ， 这 意味 着 存储 在 内 存单 元 (40)i 中 的 整数 的 副本 被 装 人 寄存 器 
Ro 中 。 





@ 取 指 人 四 译 形 


图 5-32 周期 1 的 状态 


2. 周期 2 

在 第 二 周期 开始 时 (图 5-33 )，PC 指向 程序 的 第 二 条 指令 ， 它 在 内 存单 元 (01)is 中 。 控 
制 单元 经 历 如 下 三 个 步 又 : 

1 ) 控制 单元 取出 存储 在 内 存单 元 (01)is 中 的 指令 ， 放 人 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指令 (1141))6 为 Ri 一 M4 ; 

3 ) 控制 单元 执行 指令 ， 这 意味 着 存储 在 内 存单 元 (41)i 中 的 整数 的 副本 被 北 人 寄存 逢 Ri 中 。 


rc Eo 


IR 1141 


控制 单元 





四 译 码 (1141),, 的 译 码 


© 执行 
图 5-33 周期 2 的 状态 
3. 周期 3 


在 第 三 周期 开始 时 (图 5-34 )，PC 指 回程 序 的 第 三 条 指令 ， 它 在 内 存单 元 (02)is 中 。 控 
制 单 元 经 历 如 下 三 个 步骤 : 


IR 320] 





Oi rR) G20D wnt 
全 执行 


图 5-34 周期 3 的 状态 
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1 ) 控制 单元 取出 存储 在 内 存单 元 (02)is 中 的 指令 ， 放 入 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指 令 (3201)16 为 R, 一 Ro 二 Ri; 

3 ) 控制 单元 执行 指令 ， 这 意味 着 寄存 器 Ro 的 内 容 被 加 到 寄存 器 Ri 的 内 容 上 (由 ALU 
完成 )， 结 果 放 在 Rs 中 。 

4. 周期 4 

在 第 四 周期 开始 时 (图 5-35 )，PC 指向 程序 的 第 四 条 指令 ， 它 在 内 存单 元 (03)ie 中 。 控 

1 ) 控制 单元 取出 存储 在 内 存单 元 (03)1s 中 的 指令 ， 放 人 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指令 (2422)is 为 Mas 一 R;; 

3 ) 控制 单元 执行 指令 ， 这 意味 着 寄存 器 R: 中 整数 的 副本 被 存储 到 内 存单 元 (42)ie 中 。 





全 译 王 (2422), 的 译 码 


图 5-35 周期 4 的 状态 


5. 周期 5 

在 第 五 周期 开始 时 (图 5-36 )，PC 指向 程序 的 第 五 条 指令 ， 它 在 内 存单 元 (04)ik 中 。 控 
制 单元 经 历 如 下 三 个 步骤 : 

1 ) 控制 单元 取出 存储 在 内 存单 元 (04)is 中 的 指令 ， 放 人 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指令 (0000)ie 为 Halt; 

3 ) 控制 单元 执行 指令 ， 这 意味 着 计算 机 停止 。 


5.8.8 ”为 一 个 例子 


在 前 面 的 例子 中 ， 我 们 假定 要 相 加 的 两 个 整数 已 经 在 内 存 中 ， 还 假定 相 加 的 结果 将 保存 
在 内 存 中 。 你 可 能 会 问 如 何 能 把 两 个 要 相 加 的 整数 存 到 内 存 中 ， 或 当 结 果 被 存储 在 内 存 中 ， 
如 何 使 用 这 结果 。 在 真实 情况 中 ， 我 们 使 用 像 键盘 这 样 的 输入 设备 输入 前 两 个 整数 到 内 存 
中 ， 通 过 像 监视 器 这 样 的 输出 设备 显示 第 三 个 整数 。 通 过 输入 设备 获得 数据 通常 被 称 为 读 操 
作 ， 而 向 输出 设备 发 送 数据 通常 被 称 为 写 操作 。 为 了 使 我 们 前 面 的 程序 更 实用 ， 需 要 将 其 修 
改 如 下 : 


党 了 全 


1 ) 读 整 数 ， 存 人 M4os 

2 ) Ro +— Moo 

3 ) 读 整 数 ， 存 人 Maio 

4 ) Ri*— Maie 

5) Rr+— Ro+Rio 

6 ) Maz *— Rizo 

7 ) 根据 Ms; 的 内 容 写 出 整数 。 
8 ) 停机 。 : 





@ 取 指 令 
四 译 到 (0000), 的 译 码 


图 5-36 周期 5 的 状态 


有 许多 方法 来 实现 输入 和 输出 。 如 今 大 多 数 计算 机 进行 从 输入 设备 到 内 存 的 直接 数据 
传输 和 从 内 存 到 输出 设备 的 直接 数据 传输 。 但 是 ， 简 单 计 算 机 不 是 它们 中 的 一 个 。 在 计算 
机 中 ， 可 以 使 用 LOAD 和 STORE 指令 模拟 读 和 写 操作 ， 而 且 LOAD 和 STORE 起 数 据 输 入 
到 CPU 和 从 CPU 中 写 数 据 。 我 们 需要 两 条 指令 来 读数 据 进 入 内 存 和 从 内 存 写 出 数据 。 读 操 
作为 : 

R*- Mee: 因为 刍 直 被 从 为 内 存 单 元 (PE) ca rt 

MR 和 a Tt 

写 操 作为 : 


Mre eR: 因为 监视 器 被 假定 为 内 存单 元 (Ee i lA 


你 可 能 会 问 ， 如 果 操 作 是 应 该 在 CPU 中 完成 的 ， 那么 我 们 为 什么 把 数据 从 键盘 传输 到 
CPU， 然 后 再 到 内 存 ， 然 后 再 到 CPU 进行 处 理 ? 我们 能 直接 传输 数据 到 CPU 吗 ? 答案 是 对 
这 个 小 问题 我 们 能 这 样 做 ， 但 在 原则 上 不 应 该 这 样 做 。 考 虑 一 下 ， 如 果 需 要 加 1000 个 数 ， 
或 者 对 1 000 000 个 整数 进行 排序 ，CPU 中 的 寄存 器 数目 是 有 限 的 (在 真实 的 计算 机 中 ， 它 
可 能 是 几 百 个 ， 但 仍然 是 不 够 的 )。 
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输入 操作 必须 总 是 从 输入 设备 读数 据 到 内 存 ; 输出 操作 必须 总 是 从 内 存 写 数 据 到 输出 
设备 。 人 六 a 


考虑 到 这 些 ， 程 序 被 编写 成 : 


| em | oo | cm | 


操作 1 到 4 是 输入 ， 操 作 9 和 10 是 输出 。 当 我 们 运行 这 个 程序 时 ， 它 等 待 用 户 从 键盘 
输入 两 个 整数 和 按 回 车 键 。 然 后 程序 计算 和 ， 结 果 显 示 在 监视 器 上 。 
5.8.9 可 重用 性 


与 不 可 编程 的 计算 器 相 比 ， 计 算 机 的 一 个 优点 是 我 们 能 反复 使 用 相同 的 程序 。 我 们 能 运 
行程 序 多 次 ， 每 次 键入 不 同 的 输入 ， 得 到 不 同 的 输出 。 


9.9 


章 末 材料 


推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


Englander, I. The Architecture of Computer Hardware and Systems Software, Hoboken, 
NJ: Wiley, 2003 

Mano, M. Computer System Architecture, Upper Saddle River, NJ: Prentice-Hall, 1993 
Null, L. and Lobur, J. Computer Organization and Architecture, Sudbury, MA: Jones and 
Bartlett, 2003 

Hamacher, C., Vranesic, Z. and Zaky, S$. Computer Organization, New York: McGraw- 
Hill, 2002 

Warford, S. Computer Systems, Sudbury, MA: Jones and Bartlett, 2005 

Ercegovac, M., Lang, T. and Moreno, J. Introduction to Digital Systems, Hoboken, NJ: 
Wiley, 1998 

Cragon, H, Computer Architecture and Implementation, Cambridge: Cambridge 
University Press, 2000 

Stallings, W. Computer Organization and Architecture, Upper Saddle River, NJ: Prentice- 


Hall, 2002 


关键 术语 
address bus (地 址 总 线 ) cache memory (高 速 缓冲 存储 器 ) 
address space (地址 空间 ) central processing unit (CPU， 中 央 处 理 单元 ) 


arithmetic logic unit (ALU， 算 术 逻 辑 单元 ) compact disk (CD， 光 盘 ) 
bus (总 线 ) compact disk read-only memory ( CD-ROM, 
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只 读 光 盘 ) 

compact disk recordable(CD-R， 可 刻录 光盘 ) 

complex instruction set computer (CISC， 复 
杂 指 令 集 计算 机 ) 

control bus (控制 总 线 ) 

controller (控制 器 ) 

control unit (控制 单元 ) 

data bus (数据 总 线 ) 

decode ( 译 码 ) 

digital versatile disk (DVD， 数 字 多 功能 光盘 ) 

direct memory access (DMA， 直接 存储 天 
存 取 ) 

dynamic RAM (DRAM， 动态 RAM) 

electrically erasable programmable read-only 
memory ( EEPROM， 电 可 擦 除 可 编程 只 
读 存 储 器 ) 

erasable programmable read-only memory 
(EPROM， 可 擦 除 可 编程 只 读 存 储 器 ) 

execute (执行 ) 

fetch( 取 指令 ) 

FireWire (火线 ) 

HDMI ( High-Definition Multimedia 
Interface， 高 清晰 度 多 媒体 接口 ) 

hub (集线器 ) 

input/output controller( 输 入 /输出 控制 器 ) 

input/output subsystem (输入 /输出 子 系统 ) 

instruction register (指令 寄存 器 ) 

interrupt-driven IO (中 断 驱 动 IO ) 

intersector gap ( 扇 区 间 的 间隔 ) 

intertrack gap《 磁 道 间 的 间隔 ) 

isolated IO (IO 独立 寻 址 ) 

land( 纹 间 表 面 ) 

machine cycle (机 器 周期 ) 

programmable read-only memory (PROM， 
可 编程 只 读 存储 器 ) 

magnetic disk (磁盘 ) 

magnetic tape (磁带 ) 

main memory ( 主 存 ) 


master disk ( 主 盘 ) 

memory mapped IJO (内 存 映射 IO ) 

monitor (监视 种 ) 

multiple instruction-stream, multiple data- 
stream (MIMD， 多 指令 流 多 数据 流 ) 

multiple instruction-stream, single data-stream 
(MISD， 多 指令 流 单数 据 流 ) 

nonstorage device( 非 存储 式 设备 ) 

optical storage device( 光 存储 设备 ) 

output device (输出 设备 ) 

parallel processing (并 行 处 理 ) 

pipelining (流水 线 ) 

pit( 坑 ) 

polycarbonate resin〈 聚 碳酸 本 树脂 ) 

printer (打印 机 ) 

program counter (程序 计数 器 ) 

programmed IJO (程序 控制 IO ) 

random access memory (RAM， 随 机 存 取 存 
储 器 ) 

read-only memory (ROM， 只 读 存 储 器 ) 

read/write head ( 读 / 写 头 ) 

reduced instruction set computer ( RISC， 精 
简 指 令 集 计算 机 ) 

register (寄存 器 ) 

rotational speed (转速 ) 

sector (而 区 ) 

seek time( 寻 道 时 间 ) 

single instruction-stream, multiple data-stream 
(SIMD， 单 指令 流 多 数据 流 ) 

static RAM (SRAM， 静 态 RAM) 

storage device (存储 设备 ) 

throughput (吞吐 量 ) 

topology (拓扑 结构 ) 

track( 磁 道 ) 

transfer time (传送 时 间 ) 

Universal Serial Bus (USB， 通 用 串 行 总 线 ) 

write once, read many ( WORM， 写 一 次 ， 读 


多 次 ) 
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小 结 

。 计算 机 的 组 成 分 成 三 大 类 (或 子 系统 )，CPU、 主 存 和 输入 /输出 子 系统 。 

。 中央 处 理 单元 (CPU) 执行 数据 上 的 操作 ， 它 有 三 部 分 : 算术 逻辑 单元 (ALU)、 控 
制 单元 和 一 系列 寄存 器 。 算 术 逻 辑 单元 (ALU) 负责 算术 、 移 位 和 逻辑 运算 。 寄 存 
融 是 快速 独立 的 存储 设备 ， 它 可 暂时 地 保留 数据 。 控 制 单元 控制 CPU 中 每 个 部 分 的 
操作 。 

主 存 是 存储 单元 的 集合 。 每 一 个 单元 有 一 个 称 为 地 址 的 标识 符 。 数 据 被 传输 到 内 存 或 

从 内 存 取出 是 以 称 为 字 的 二 进 制 位 组 的 方式 。 内 存 中 唯一 可 标识 的 单元 总 数 称 为 地 址 

空间 。 有 两 种 内 存 可 用 : 随机 存 取 存 储 器 (RAM) 和 只 读 存储 器 (ROM )。 

。 输入 /输出 (IO) 子 系统 的 设备 集合 允许 计算 机 与 外 界 通信 ， 存 储 程序 和 数据 ， 即 使 
在 计算 机 已 关机 时 也 可 以 。 输 入 /输出 设备 分 成 两 大 类 : 非 存储 设备 和 存储 设备 。 非 
存储 设备 允许 CPU/ 内 存 与 外 界 通信 ; 存储 设备 可 以 存储 以 后 被 检索 的 大 量 信息 。 存 
储 设备 被 分 成 磁 的 和 光 的 。 

。 计算 机 中 三 个 子 系统 的 连接 起 重要 的 作用 ， 因 为 在 这 些 子 系统 间 需 要 进行 信息 的 通 

信 。CPU 和 内 存 通常 被 三 个 连接 连 在 一 起 (每 个 称 为 总 线 ) : 数据 总 线 、 地 址 总 线 和 

控制 总 线 。 输 入 /输出 设备 通过 输入 / 输出 控制 器 或 接口 与 总 线 相连 ， 使 用 的 控制 器 

有 多 种 ， 如 今 常 见 的 有 SCSI、 火 线 和 USB。 

有 两 种 输入 /输出 设备 的 寻 址 方法 : IO 独立 寻 址 和 1/0 存储 器 映射 寻 址 。 在 IO 独 

立 寻 址 方法 中 ， 用 来 从 (或 到 ) 内 存 读 / 写 的 指令 完全 不 同 于 用 来 从 (或 到 ) 输入 / 输 

出 设备 的 读 / 写 指令 。 在 1/0 存储 器 映射 寻 址 方法 中 ，CPU 把 IO 控制 器 中 的 每 个 寄 

存 器 看 成 是 内 存 中 的 一 个 字 。 

如 今 ， 通 用 计算 机 使 用 称 为 程序 的 一 组 指令 来 处 理 数据 。 计 算 机 执行 程序 ， 从 输入 

数据 创建 输出 数据 。 程 序 和 数据 都 存储 在 内 存 中 。CPU 使 用 重复 的 机 器 周期 一 条 

接 一 条 ， 从 头 到 尾 执行 程序 中 的 指令 。 简 化 的 周期 由 三 阶段 组 成 : 取 指 令 、 译 码 和 

执行 。 

有 三 种 使 CPU 和 输入 /输出 设备 同步 的 方法 : 程序 控制 输入 /输出 、 中 断 控 制 输入 / 

输出 和 直接 存储 器 存 取 (DMA ) 。 

在 最 近 的 几 十 年 中 ， 计 算 机 的 体系 结构 和 组 织 经 历 了 许多 变化 。 计 算 机 体系 结构 分 成 

两 大 类 : CISC (复杂 指令 集 计 算 机 ) 和 RISC (精简 指令 集 计 算 机 )。 

。 现代 计算 机 使 用 流水 线 技 术 提高 吞吐 量 。 这 个 理念 允许 控制 单元 同时 执行 两 个 或 三 个 
阶段 ， 这 意味 着 下 一 条 指令 的 处 理 可 以 在 前 一 条 结束 前 开始 。 

。 计算 机 传统 上 有 一 个 控制 单元 、 一 个 算术 逻辑 单元 和 一 个 内 存单 元 。 并 行 处 理 通 过 使 
用 多 指令 流 处 理 多 数据 流 来 改善 吞吐 量 。 


5.10 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相 
关 测 验 题 以 检测 对 本 章 内 容 的 理解 。 


90 


锚 5 芋 


复习 题 


Q5-1 
Q5-2 
Q5-3 
Q5-4 
Q5-5 
Q5-6 
Q5-7 
Q5-8 
Q5-9 
Q5-10 
Q5-11 
Q5-12 
Q5-13 
Q5-14 
Q5-15 
Q5-16 


计算 机 由 哪 三 个 子 系统 组 成 ? 

CPU 由 哪 几 个 部 分 组 成 ? 

ALU 的 功能 是 什么 ? 

控制 单元 的 功能 是 什么 ? 

主 存 的 功能 是 什么 ? 

定义 RAM、ROM、SRAM、DRAM、PROM、EPROM 和 EEPROM。 

高 速 缓冲 存储 器 的 作用 是 什么 ? 

描述 一 下 磁盘 的 物理 组 成 。 

磁盘 和 磁带 表面 是 怎样 组 织 的 ? 
比较 分 析 CD-R、CD-RW 和 DVD。 
比较 分 析 SCSI、 火 线 和 USB 控制 器 。 
比较 分 析 两 种 IO 设备 寻 址 的 方法 。 
比较 分 析 三 种 同步 CPU 和 I/O 设备 的 方法 。 
比较 分 析 CISC 体系 结构 和 RISC 体系 结构 。 
描述 流水 线 及 其 作用 。 
描述 并 行 处 理 及 其 作用 。 


练习 题 


P5-1 
P5-2 
P5-3 
P5-4 
P5-5 
P5-6 
P5-7 
P5-8 
P5-9 
P5-10 


P5-11 


P5-12 


P5-13 


一 台 计 算 机 有 64 MB ( 兆 字 节 ) 的 内 存 ， 每 个 字 长 为 4 字 节 。 和 那么 在 存储 器 中 对 每 个 字 寻 址 需 
要 多 少 位 ? 
如 果 屏 幕 有 24 行 ， 每 行 80 个 字符 ， 则 需要 多 少 字 节 的 内 存 用 于 存储 全 屏 的 数据 ? 如 果 系 统 使 
用 ASCII 码 ， 每 个 ASCII 字符 占 1 字 节 。 
假如 一 台 计 算 机 有 16 个 数据 寄存 器 (R0~R15 )、1024 个 字 的 存储 空间 以 及 16 种 不 同 的 指令 
(如 add、subtract 等 )， 那 么 下 面 这 条 指令 最 少 需要 占 多 少 位 空间 ? 
add M R2 
在 P5-3 题 中 ， 如 果 数 据 和 指令 使 用 相同 的 字 长 ， 那 么 每 个 数据 寄存 器 大 小 是 多 少 ? 
在 P5-3 题 中 ， 计 算 机 中 的 指令 寄存 器 大 小 是 多 少 ? 
在 P5-3 题 中 ， 计 算 机 中 的 程序 计数 器 大 小 是 多 少 ? 
在 P5-3 题 中 ， 数 据 总 线 为 多 少 位 ? 
在 P5-3 题 中 ， 地 址 总 线 为 多 少 位 ? 
在 P5-3 题 中 ， 控 制 总 线 最 少 需 要 多 少 位 ? 
计算 机 使 用 IO 独立 寻 址 。 内 存 为 1024 个 字 。 如 果 每 个 控制 器 包括 16 个 寄存 器 ， 那 么 计算 
机 可 以 存 取 多 少 个 控制 器 ? 
计算 机 使 用 IO 存储 器 映射 寻 址 。 地 址 总 线 为 10 条 (10 位 )。 如 果 内 存 为 1000 个 字 ， 那么 计 
算 机 可 以 存 取 多 少 个 四 位 寄存 器 控制 器 ? 
使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 编 写 执行 下 列 计算 的 程序 代码 ， 
DA+B+C 
A、B、C 和 D 是 二 进 制 补 码 格式 的 整数 ， 用 户 输入 A、B 和 C 的 值 , D 的 值 显示 在 监视 器 上 。 
使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 编 写 执行 下 列 计算 的 程序 代码 ; 
B 一 A+3 
A 和 3 是 二 进 制 补 码 格式 的 整数 ， 用 户 输入 A 的 值 ，B 的 值 显示 在 监视 器 上 。( 提 示 : 使 
用 加 1 指令 )。 
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P5-14 使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 编 写 执 行 下 列 计算 的 程序 代码 : 
B—A-2 
A 和 2 是 二 进 制 补 码 格式 的 整数 ， 用 户 输入 A 的 值 ，B 的 值 显示 在 监视 器 上 。( 提 示 ; 使 

用 减 1 指令 )。 

P5-15 使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 为 程序 编写 代码 ， 该 程序 完成 n 个 从 键盘 输入 的 整数 的 相 
加 ， 并 显示 它们 的 和 。 你 首先 需要 输入 n 的 值 。( 提 示 : 使 用 减 1 指令 和 跳 转 指令 ， 重复 n 次 
加 运算 )。 

P5-16 使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 为 程序 编写 代码 ， 该 程序 接收 从 键盘 来 的 两 个 整数 ， 如 果 
第 一 个 整数 为 0， 程 序 把 第 二 个 整数 加 1 ; 如 果 第 一 个 整数 是 1， 程 序 把 第 二 个 整数 减 1。 第 
一 个 整数 必须 是 0 或 1， 否则 程序 失败 。 程 序 显示 加 1 或 减 1 的 结果 。 
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个 人 计算 机 的 发 展 带动 了 商业 、 工 业 、 科 学 和 教育 的 巨大 改变 。 网 络 也 发 生 了 类 伏 的 变 
革 。 技 术 的 进步 使 得 通信 线路 能 传送 更 多 、 更 快 的 信号 。 而 不 断 发 展 的 服务 使 得 我 们 能 够 使 
用 这 些 扩展 的 能 力 。 计 算 机 网 络 领域 的 研究 导致 了 新 技术 的 产生 一 一 在 全 球 各 个 地 方 交 换文 
本 、 音 频 和 视频 等 数据 ， 在 任何 时 候 快 速 、 准 确 地 下 载 或 上 载 信息 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 ; 

。 描述 局 域 网 和 广域网 (LAN 和 WAN); 

。 区 分 因特网 与 互联 网 ; 

。 描述 作为 因特网 网 络 模型 的 TCP/IP 协议 族 ; 

。 定义 TCP/IP 协议 族 中 的 各 层 以 及 它们 的 关系 ; 

。 从 应 用 层面 描述 一 些 应 用 ; 

。 描述 传输 层 协议 提供 的 服务 ; 

。 描述 网 络 层 协议 提供 的 服务 ; 

。 描述 数据 链 路 层 使 用 的 不 同 协议 ; 

。 描述 物理 层 的 责任 ; 

。 描述 在 计算 机 网 络 中 使 用 的 不 同 传输 媒介 。 


6.1 引言 

虽然 本 章 的 目标 是 讨论 因特网 一 一 一 个 将 世界 上 几 十 亿 台 计算 机 互相 连接 的 系统 ， 但 我 
们 对 因特网 的 认识 不 应 该 是 一 个 单独 的 网 络 ， 而 是 一 个 网 络 结合 体 一 一 互联 网 络 。 因 此 ， 我 
们 的 旅程 将 从 定义 一 个 网 络 开始 ， 然 后 展示 如 何 通 过 网 络 连接 来 建造 小 型 的 互联 网 络 。 最 终 
我 们 会 展示 因特网 的 结构 并 且 在 本 章 的 余下 部 分 开启 研究 因特网 的 大 门 。 


6.1.1 网 络 

网 络 是 一 系列 可 用 于 通信 的 设备 相互 连接 构成 的 。 在 这 个 定义 里 面 ， 一 个 设备 可 以 是 
一 台 主 机 (或 用 另 一 种 称呼 ， 端 系统 )， 比 如 一 台大 型 计算 机 、 台 式 机 、 便 携 式 计算 机 、 工 
作 站 、 手 机 或 安全 系统 。 在 这 个 定义 中 ,设备 也 可 以 是 一 个 连接 设备 ， 比 如 用 来 将 一 个 网 络 
与 男 一 个 网 络 相 连接 的 路 由 器 ， 一 个 将 不 同 设备 连接 在 一 起 的 交换 机 ， 或 者 一 个 用 于 改变 数 
据 形式 的 调制 解 调 器 ， 等 等 。 在 一 个 网 络 中 ， 这 些 设备 都 通过 有 线 或 无 线 传输 媒介 (比如 电 
缆 或 无 线 信号 ) 互相 连接 。 当 我 们 在 家 通过 即 播 即 用 路 由 器 连接 两 台 计算 机 时 ， 虽 然 规模 很 
小 ， 但 已 经 建造 了 一 个 网 络 。 

1. 局 域 网 

局 域 网 (LAN) 通常 是 与 单个 办 公 室 、 建 筑 或 校园 内 的 几 个 主机 相连 的 私有 了 网络。 基于 
机 构 的 需求 ， 一 个 局 域 网 既 可 以 简单 到 某 人 家 庭 办 公 室 中 的 两 台 个 人 计算 机 和 一 台 打 印 机 ， 
也 可 以 扩大 至 一 个 公司 范围 ， 并 包括 音频 和 视频 设备 。 在 一 个 局 域 网 中 的 每 一 台 主 机 都 有 作 
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为 这 台 主 机 在 局 域 网 中 唯一 定义 的 一 个 标识 符 和 一 个 地 址 。 一 台 主 机 向 另 一 台 主 机 发 送 的 数 

据 包 中 包括 源 主机 和 目标 主机 的 地 址 。 图 6-1 展 主机 1 主机 2 ”主机 3 ”主机 4 

示 了 局 域 网 的 一 个 例子 。 证 
2. 广域网 _- | 





广域网 (4 WAN) 也 是 通信 设备 互 连 构成 的 。 导 、 
但 是 广域网 与 局 域 网 之 间 有 一 些 差 别 。 局 域 网 的 
大 小 通常 是 受 限制 的 ， 跨 越 一 个 办 公 室 、 一 座 大 
楼 或 一 个 校园 ; 而 广域网 的 地 理 跨 度 更 大 ， 可 以 
横 跨 一 个 城镇 、 一 个 州 、 一 个 国家 ， 甚 至 横 跨 世 
界 。 局 域 网 将 主机 互 连 ， 广 域 网 则 将 交换 机 、 路 由 器 或 调制 解 调 器 之 类 的 连接 设备 互 连 。 通 
常 ， 局 域 网 为 机 构 私有 ， 广 域 网 则 由 通信 公司 创建 并 运营 ， 并 且 租 给 使 用 它 的 机 构 。 我 们 可 
以 看 到 广域网 的 两 种 截然 不 同 的 案例 : 点 对 点 广域网 和 交换 广域网 ， 如 图 6-2 所 示 。 


到 另 一 个 网 络 一 一 到 另 一 个 网 络 


a) 点 对 点 广域网 
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主机 5 主机 6 ”主机 7 ”主机 8 
图 6-1 LAN 的 例子 
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到 另 一 个 网 络 到 另 一 个 网 络 
b) 交换 广域网 
图 6-2 点 对 点 广域网 和 交换 广域网 


氮 对 点 广域网 是 通过 传输 媒介 (电缆 或 无 线 ) 连接 两 个 通信 设备 的 网 络 。 

交换 广域网 是 一 个 有 至 少 两 个 端的 网 络 。 就 像 我 们 很 快 就 会 看 到 的 那样 ， 交 换 广 域 网 用 
于 当今 全 球 通 信 的 骨干 网 。 我 们 也 可 以 这 么 说 ， 交 换 广域网 是 几 个 点 对 点 广域网 通过 开关 连 
接 产 生 的 结合 体 。 

3. 互联 网 络 

如 今 ， 很 难看 见 独立 存在 的 局 域 网 或 广域网 ， 它 们 现在 都 是 互相 连接 的 。 当 两 个 
或 多 个 网 络 互相 连接 时 ， 它 们 构成 一 个 互联 网 络 ， 或 者 说 网 际 网 。 举 一 个 例子 ， 假 设 一 
个 机 构 有 两 个 办 公 室 ， 并 且 两 个 办 公 室 都 通过 局 域 网 来 进行 办 公 室内 所 有 雇员 之 间 的 通 
信 ， 那 么 为 了 使 不 同 办 公 室 的 雇员 之 间 的 通信 成 为 可 能 ， 管 理 部 门 从 电话 公司 之 类 的 服务 
供应 商 那里 租用 了 一 个 无 须 拨号 的 点 对 点 广域网 并 且 将 两 个 局 域 网 相连 。 现 在 这 个 公司 ， 
就 拥有 了 一 个 互联 网 络 ， 或 者 说 一 个 私人 网 际 网 ， 不 同 办 公 室 之 间 的 通信 也 可 以 实现 了 。 
图 6-3 展示 了 这 个 互联 网 络 。 


6.1.2 因特网 
正如 我 们 之 前 讨论 过 的 ， 一 个 网 际 网 (注意 internet 的 i) 是 两 个 或 多 个 可 以 互相 通信 的 


到 另 一 个 网 络 
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网 络 。 最 值得 注意 的 网 际 网 是 因特网 (注意 Internet 的 1)， 它 由 成 千 上 万 个 互 连 的 网 络 组 成 。 
图 6-4 展示 了 因特网 的 一 个 概念 图 像 (而 非 地 理 图 像 )。 


用 户 





图 6-3 一 个 由 2 个 局 域 网 和 3 个 广域网 构成 的 互联 网 络 


供应 商 网 络 






供应 商 网 络 和 


供应 商 网 络 供应 两 网 络 


图 6-4 ”当今 的 因特网 


二 
供应 两 网 络 


这 幅 图 将 因特网 展示 为 几 个 骨干 网 、 供 应 商 网 络 和 客户 网 络 。 在 顶层 ， 骨 干 网 为 通信 公 
司 所 拥有 ， 这 些 骨 干 网 通过 一 些 复 杂 的 交换 系统 相互 连接 。 我 们 把 这 些 交换 系统 称 为 网 络 对 
等 交汇 点 (peering point)。 在 第 二 层 ， 有 一 些 规 模 较 小 的 网 络 ， 这 些 网 络 称 为 供应 商 网 络 ， 
它们 付费 使 用 骨干 网 上 的 一 些 服务 。 这 些 供 应 商 网 络 与 骨干 网 相连 接 ， 有 时 也 连接 其 他 供应 
商 网 络 。 在 因特网 的 边缘 有 一 些 真正 使 用 基于 因特网 的 服务 的 网 络 ， 这 些 网 络 是 客户 网 络 ， 
它们 向 供应 商 网 络 付费 来 得 到 服务 。 

骨干 网 和 供应 商 网 络 也 被 称 为 因特网 服务 供应 商 (ISP)， 上 骨干 网 通常 被 称 为 国际 因特网 
服务 供应 商 ， 供 应 商 网 络 则 被 称 为 国内 或 地 域 性 因特网 服务 供应 商 。 
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6.1.3 ”硬件 和 软件 

我 们 已 经 展示 了 因特网 通过 连接 设备 将 大 大 小 小 的 网 络 互相 交织 在 一 起 构成 的 基本 结 
构 。 然 而 ， 如 果 仅 仅 将 这 些 部 分 连接 在 一 起 ， 很 明显 什么 都 不 会 发 生 。 为 了 产生 通信 ， 既 需 
要 硬件 也 需要 软件 设备 。 这 就 像 当 进 行 一 个 复杂 的 计算 时 ， 我 们 同时 需要 计算 机 和 程序 。 下 
一 节 将 展现 这 些 硬 件 和 软件 的 组 合 是 如 何 通过 协议 分 层 来 互相 配合 的 。 


6.1.4 协议 分 层 

当 谈 论 因特网 时 ， 有 一 个 词 我 们 总 是 会 听 到 ， 这 个 词 就 是 协议 。 协 议定 义 了 发 送 姑 、 接 
收 器 以 及 所 有 中 间 设 备 必须 遵守 以 保证 有 效 地 通信 的 规则 。 简 单 的 通信 可 能 只 需要 一 条 简单 
的 协议 ， 当 通信 变 得 复杂 时 ， 可 能 需要 将 任务 分 配 到 不 同 的 协议 层 中 ， 在 这 种 情况 下 ， 我 们 
在 每 一 个 协议 层 都 需要 一 个 协议 ， 或 者 协议 分 层 。 

1. 场景 

为 了 更 好 地 理解 协议 分 层 的 必要 性 ， 首 先 我 们 开发 一 个 简单 的 场景 。 假 定 Ann 和 Maria 
是 有 很 多 共同 想法 的 邻居 ， 她 们 每 次 都 会 为 了 一 个 何 时 退休 的 计划 互相 见面 并 进行 沟通 。 突 
然 ，Ann 所 在 的 公司 为 她 提供 了 一 个 升 职 的 机 会 ， 但 是 同时 要 求 她 搬 到 离 Maria 很 远 的 一 个 
城市 中 的 分 部 去 住 。 由 于 她 们 想 出 了 一 个 具有 创新 性 的 计划 一 一 在 退休 后 开始 做 新 的 生意 ， 
这 两 个 朋友 仍然 想 继续 她 们 的 通信 并 且 就 这 个 新 计划 交换 想法 。 她 们 决定 通过 到 邮局 使 用 
普通 邮件 通信 来 继续 她 们 的 对 话 ， 但 是 如 果 邮 件 被 拦截 了 ， 她 们 又 不 希望 别人 知晓 她 们 的 想 
法 。 她 们 在 邮件 的 加 密 /解密 方式 上 达成 了 一 致 ， 寄 信人 对 邮件 进行 加 密 ， 这 样 对 于 入 侵 者 
而 言 邮件 就 是 无 法 阅读 的 ; 同时 收 信 人 对 邮件 进行 解密 以 得 到 原始 信件 。 第 16 章 将 讨论 加 
密 /解密 方 法 , 但 是 现在 我 们 可 以 推测 Maria 和 Ann 使 用 了 其 中 一 种 使 没有 密 钥 的 人 很 难 对 
信件 进行 解密 的 技术 。 这 样 ， 可 以 把 Maria 和 Ann 之 间 的 通信 分 成 三 个 协议 层 ， 如 图 6-5 所 
示 。 假 设 Ann 和 Maria 都 各 自 拥有 三 台 机 器 (或 机 器 人 ) 来 完成 每 一 个 协议 层 的 任务 。 









Mana 东 Ann 个 
第 三 第 三 
同一 对 象 
第 二 层 第 二 层 
第 一 层 Wm 






if 件 + 一 一 一 、 邮件 区 二 





邮局 的 邮递 员 功 能 
图 6-5 一 个 三 层 协议 


假设 Maria 将 第 一 封 邮件 寄 给 Ann。Maria 假设 第 三 协议 层 机 器 是 正在 听 她 说 话 的 Ann 
并 对 其 说 话 ， 第 三 协议 层 的 机 器 听 她 说 话 并 且 创 作出 明文 (一 封 用 英语 写 的 信 )， 并 被 传送 
到 第 二 层 的 机 器 ， 第 二 协议 层 的 机 器 对 文本 进行 加 密 ， 将 它 创 作成 密 文 ， 并 传送 到 第 一 协议 
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层 的 机 器 。 这 个 第 一 协议 层 的 机 器 ， 也 许 是 一 个 机 器 人 ， 把 密 文 装 进 信封 ， 加 上 发 信人 和 收 
信人 地 址 ， 然 后 将 信 寄 出 。 

在 Ann 这 边 ， 第 一 协议 层 的 机 器 从 Ann 的 邮箱 中 取出 邮件 并 通过 发 信人 地 址 找 出 来 自 
Maria 的 这 一 封 。 它 从 信封 中 取出 密 文 并 传递 给 第 二 协议 层 的 机 器 ， 第 二 协议 层 的 机 器 对 密 
文 进行 解密 ， 创 作出 明文 并 传递 给 第 三 协议 层 的 机 器 ， 第 三 协议 层 的 机 器 接受 明文 并 且 将 它 
读 出 来 ， 就 像 Maria 在 说 话 一 样 。 

协议 分 层 使 我 们 可 以 将 大 任务 化 简 成 几 个 更 小 、 更 简单 的 任务 。 例 如 ， 在 图 6-5 中 我 
们 可 以 只 用 一 台 机 器 来 完成 三 台 机 器 的 全 部 工作 ， 但是， 如 果 Maria 和 Ann 觉得 机 器 完成 
的 现 有 加 密 或 解密 无 法 保证 她 们 的 保密 ， 她 们 需要 替换 整个 机 器 。 在 现在 的 情况 下 ， 她 们 
只 需要 替换 第 二 协议 层 的 机 器 就 足够 了 ， 另 外 两 层 可 以 保持 不 变 ， 这 称 为 模块 化 。 在 这 里 
模块 化 指 的 是 独立 的 协议 层 。 一 个 协议 层 (模块 ) 可 以 定义 为 一 个 具有 输入 和 输出 而 不 需 
要 考虑 输入 是 如 何 变 成 输出 的 黑匣子 。 当 向 两 台 机 器 提供 相同 输入 得 到 相同 输出 时 ， 它 们 
就 可 以 相互 替换 。 例 如 ，Ann 和 Maria 可 以 从 两 个 不 同 的 制造 商 那里 购买 第 二 协议 层 的 机 
器 ， 只 要 两 台 机 器 可 以 利用 相同 的 明文 创作 出 相同 的 密 文 ， 反 之 亦 然 ， 她 们 就 可 以 完成 这 个 
工作 。 

协议 分 层 的 一 个 优势 就 是 可 以 将 服务 和 其 实现 分 开 。 每 层 使 用 更 低层 的 服务 ， 并 向 较 高 
一 层 提供 服务 ， 并 且 我 们 不 需要 考虑 该 层 是 如 何 实施 的 。 例 如 ，Maria 也 许 因 为 可 以 自己 完 
成 第 一 协议 层 的 工作 而 决定 不 买 第 一 协议 层 的 计算 机 (机 器 人 )。 只 要 Maria 可 以 完成 第 一 
协议 层 提 供 的 工作 ， 这 个 通信 系统 就 可 以 正常 地 双向 运行 。 

协议 层 的 另 一 个 优势 虽然 在 简单 的 例子 中 无 法 看 出 ， 但 是 在 我 们 讨论 因特网 中 的 协议 分 
层 时 会 表现 出 来 ， 因 为 通信 系统 往往 不 仅仅 具有 两 个 端 系统 ， 还 有 一 些 只 需要 几 个 协议 层 而 
不 是 所 有 协议 层 的 中 间 系 统 。 如 果 我 们 不 使 用 协议 分 层 ， 整 个 系统 会 变 得 更 复杂 ， 因 为 那样 
我 们 要 把 每 一 个 中 间 系 统 都 变 得 和 端 系统 一 样 复 杂 。 

协议 分 层 有 什么 劣势 吗 ? 也 许 有 人 会 认为 单一 协议 层 可 以 使 整个 工作 变 简单 ， 而 且 没 
有 每 个 协议 层 都 使 用 低 一 级 协议 层 的 服务 并 向 高 一 级 协议 层 提 供 服务 的 需求 。 例 如 ，Ann 
和 Maria 可 以 自己 制作 能 完成 三 项 任务 的 机 器 。 但 是 ， 就 像 之 前 提 到 的 那样 ， 一 旦 密码 被 破 
解 ， 她 们 每 一 个 人 就 要 将 整个 机 器 换 成 新 的 而 不 是 仅仅 更 换 第 二 协议 层 。 

2. 协议 分 层 的 原则 

我 们 讨论 一 下 协议 分 层 的 原则 。 第 一 条 原则 规定 ， 如 果 我 们 想 达 到 双向 通信 ， 就 需要 
保证 每 一 个 协议 层 都 可 以 进行 两 个 对 立 且 方向 相反 的 工作 。 例 如 ， 第 三 协议 层 的 工作 是 去 听 
(在 一 个 方向 上 ) 和 说 〈 在 另 一 个 方向 上 )， 第 二 协议 层 同 时 需要 能 够 进行 加 密 和 解密 工作 ， 
第 一 协议 层 需要 发 送 和 接收 邮件 。 

在 协议 分 层 中 ， 我 们 需要 遵守 的 第 二 条 重要 原则 是 在 两 个 站 点 中 每 一 层 的 两 个 对 象 必须 
完全 相同 。 例 如 ， 在 两 个 站 点 中 第 三 层 的 对 象 都 应 该 是 明文 信件 ， 而 在 两 个 站 点 中 第 二 层 的 
对 象 都 应 该 是 密 文 信件 ， 在 第 一 层 则 都 是 一 封 信 。 

3. 逻辑 连接 

在 遵循 以 上 两 条 原则 之 后 ， 我 们 可 以 按 如 图 6-6 所 示 理 解 每 个 协议 层 之 间 的 逻辑 连接 。 
这 说 明了 层 与 层 之 间 通 信 的 存在 。Maria 和 Ann 可 以 认为 她 们 能 够 发 送 该 协议 层 创作 的 对 象 
是 基于 每 层 的 逻辑 (假想 的 ) 连接 。 逻 辑 连接 的 概念 会 帮助 我 们 更 好 地 理解 在 数据 通信 和 建 
立 数据 关系 网 络 中 遇 到 的 分 层 工作 。 
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第 二 层 





加 密 /解密 





寄 信 / 收 信 





图 6-6 对 等 协议 层 之 间 的 逻辑 连接 


6.1.5 TCPI/IP 协议 族 

通过 第 二 个 场景 我 们 了 解 了 协议 分 层 和 协议 层 之 间 的 逻辑 通信 ， 这 样 就 可 以 引入 传输 控 
制 协议 / 网 际 协议 (TCP/IP)。 如 今 因特网 中 
使 用 的 协议 集 (一 组 通过 不 同 分 层 进 行 组 织 











的 协议 ) 被 称 为 TCP/IP 协议 族 。TCP/P 协 第 四 层 
议 族 是 一 个 分 层 协 议 ， 它 由 提供 特定 功能 的 第 三 
交互 式 模块 组 成 。 分 层 这 个 术语 说 明 每 一 个 
高 层 协议 都 基于 一 个 或 多 个 低层 协议 提供 的 第 一 层 
服务 。TCP/IP 协议 族 由 图 6-7 所 示 的 五 个 层 第 一 层 
次 组 成 。 

1. 分 层 架 构 图 6-7 TCP/IP 协议 族 的 层次 


为 了 展示 TCP/IP 协议 族 中 的 分 层 是 如 何在 两 台 主 机 通信 中 作用 的 ， 我 们 假设 要 使 用 的 
一 套 东西 在 一 个 由 3 个 LAN (链接) 构成 的 小 网 络 中 ， 且 链 路 层 交 换 机 与 每 个 LAN (链接 ) 
相连 。 同 时 我 们 假定 这 些 链接 都 与 同一 个 路 由 器 相连 ， 如 图 6-8 所 示 。 


源 (A) 目标 (B) 
应 用 层 | | 仿 1 应 用 层 
传输 层 图 路 由 器 中 可 传输 层 
网 络 层 | 交换 机 | 一] 网 络 层 。 交换 机 1 网络 层 
数据 链 路 层 [上 数据 链 路 导 | p= | 数据 链 路 层 | 1 1 数据 链 路 层 | pl 1 数据 链 路 层 [ 1 上 数据 链 路 层 


物理 层 [物理 层 [= 物理 层 [加 [ 门 风 理 层 。 于 和 物 理 居 站 物 理 层 


从 A 到 B 的 通信 
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我 们 假设 计算 机 A 与 计算 机 B 通信 。 如 图 6-8 所 示 ， 在 这 个 通信 中 有 5 个 通信 设备 : 
源 主机 (计算 机 A)、 链 接 1 中 的 链 路 层 交换 机 、 路 由 器 、 链 接 2 中 的 链 路 层 交 换 机 、 目 标 
主机 (计算 机 B)。 每 个 设备 涉及 的 层 组 都 由 其 在 网 络 上 扮演 的 角色 所 涉及 的 层 组 决定 。 两 
台 主 机 都 涉及 5 个 协议 层 ， 同 时 源 主机 需要 在 应 用 层 中 创建 消息 并 将 其 通过 协议 层 向 下 发 
送 ， 这 样 这 条 消息 才能 物理 地 发 送 至 目标 主机 。 目 标 主机 需要 在 物理 层 接收 通信 并 通过 其 他 
协议 层 将 其 发 送 至 应 用 层 。 

路 由 器 只 涉及 三 个 层 ， 由 于 路 由 器 仅 用 来 路 由 ， 所 以 在 路 由 器 中 没有 传输 层 或 应 用 层 。 
虽然 路 由 器 总 是 包括 在 一 个 网 络 层 中 ， 但 是 它 仅仅 被 包括 在 n 个 链接 和 物理 层 的 组 合 中 ， 这 
里 的 nn 指 与 路 由 器 相连 的 链接 数 。 因 为 每 个 链接 都 可 能 使 用 它 自己 的 数据 链 路 层 协议 或 物理 
层 协 议 。 例 如 ， 在 上 面 这 张 图 中 ， 路 由 器 被 包含 在 3 个 链接 中 ， 但 是 从 源 A 发 送 到 目标 B 
的 消息 只 涉及 两 条 链接 。 每 个 链接 都 可 能 使 用 不 同 的 链 路 层 和 物理 层 协议 ， 所 以 路 由 器 需要 
基于 一 对 协议 接收 来 自 链接 1 的 数据 包 ， 然 后 基于 另 一 对 协议 将 其 数据 包 发 送 至 链接 2。 

然而 ， 链 接 中 的 链 路 层 交 换 机 只 涉及 两 个 协议 层 : 数据 链 路 层 和 物理 层 。 虽 然 上 述 图 中 
的 每 个 交换 机 都 有 两 个 不 同 的 连接 ,但 是 这 些 连接 都 在 同一 个 链接 中 ， 这 些 链 接 仅 使 用 一 组 
协议 。 这 意味 着 ， 与 路 由 器 不 同 的 是 ， 链 路 层 交换 机 只 涉及 一 个 数据 链 路 层 和 一 个 物理 层 。 

2. 地 址 和 数据 包 名 称 

在 因特网 中 ， 另 外 两 个 和 协议 分 层 有 关 的 概念 很 值得 一 提 ， 它 们 是 地 址 和 数据 包 名 称 。 
就 像 我 们 之 前 讨论 过 的 那样 ， 在 这 个 模型 中 ， 我 们 有 层 组 之 间 的 逻辑 通信 。 任 何 涉及 两 方 的 
通信 都 需要 两 个 地 址 : 源 地 址 和 目标 地 址 。 虽 然 看 上 去 我 们 需要 5 组 地 址 ， 每 个 协议 层 一 
组 ， 但 是 正常 情况 下 只 有 4 组， 因为 物理 层 不 需要 地 址 。 这 是 由 于 物理 层 数据 交换 的 单位 是 
位 ， 这 使 它 无 法 得 到 地 址 。 图 6-9 展示 了 每 一 层 的 数据 包 名 称 和 地 址 。 


源 地 址 和 目标 地 址 





图 6-9 TCP/IP 协议 族 中 的 地 址 和 数据 包 名 称 


如 图 6-9 所 示 ， 协 议 层 和 在 该 协议 层 使 用 的 地 址 以 及 数据 包 名 称 之 间 存 在 联系 。 在 应 
用 层 ， 我 们 通常 使 用 名 称 ( 比 如 someorg.com) 或 者 邮箱 地 址 (比如 somebody@coldmail. 
com) 来 定义 提供 服务 的 站 点 。 在 传输 层 ， 地 址 被 称 为 端口 号 ， 端 口号 的 作用 是 在 源 和 目标 
之 间 定 义 应 用 层 程 序 。 端 口号 通过 各 程序 的 本 地 地 址 来 辨别 多 个 同时 运行 的 本 地 程序 。 在 
网 络 层 ， 这 些 地址 在 整个 因特网 范围 下 是 全 球 化 的 ， 网 络 层 的 地 址 独一无二 地 定义 了 该 设 
备 与 因特网 的 连接 。 链 路 层 地 址 ， 有 时 称 为 MAC 地 址 ， 是 在 本 地 定义 的 地 址 ， 每 一 个 链 
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路 层 地 址 在 计算 机 网 络 (局 域 网 (LAN) 或 广域网 ( WAN)) 中 定义 一 个 特定 的 主机 或 者 路 
由 央 。 
6.2 应 用 层 

在 简单 讨论 网 络 、 互 联网 络 和 因特网 之 后 ， 我 们 准备 好 来 进行 一 些 有 关 TCP/P 协议 族 
中 每 一 层 的 讨论 。 我 们 从 第 五 层 向 第 一 层 进行 讨论 。 

TCP/IP 协议 族 的 第 五 层 叫 作 应 用 层 。 应 用 层 向 用 户 提供 服务 。 通 信 由 逻辑 连接 提供 ， 
也 就 是 说 ， 假 设 两 个 应 用 层 通 过 它们 之 间 假 想 的 直接 连接 发 送 和 接收 消息 。 如 图 6-10 显示 
了 逻辑 连接 背后 的 思想 。 


Sky Research 公 司 Alice 
Alice 








到 其 他 ISP ,wwwsssd。 EP € 


到 其 他 ISP wow 


ob ee 
Scientific Books 在 线 书 商 
图 6-10 ”应 用 层 的 逻辑 连接 





上 图 显示 了 一 个 场景 ， 在 这 个 场景 中 ，Sky Research 科研 公司 的 科学 家 需要 到 一 个 叫 作 
Scientific Books 的 在 线 书 商 那里 订购 一 本 与 她 的 研究 方向 有 关 的 书 。Sky Research 科研 公司 
的 计算 机 的 应 用 层 和 Scientific Books 的 一 台 服 务 器 的 应 用 层 之 间 就 产生 了 逻辑 连接 。 我 们 
把 第 一 台 主 机 叫 作 Alice， 第 二 台 主 机 叫 作 Bob。 这 个 应 用 层 的 通信 是 逻辑 上 的 而 不 是 物理 
上 的 ， 也 就 是 说 ， 假 设 Alice 和 Bob 之 间 有 一 个 双向 的 逻辑 信道 来 发 送 和 接收 消息 ， 但 是 实 
际 上 的 通信 和 则 如 图 6-10 所 示 通 过 一 些 设备 (Alice、R2、R4、R、R7 和 Bob) 和 一 些 物理 信 
道 产生 。 
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6.2.1 提供 服务 
应 用 层 与 其 他 层 不 同 的 地 方 在 于 ， 它 是 协议 族 中 的 最 高 层 。 这 一 层 中 的 协议 不 向 其 他 协 
议 提供 服务 ， 它 们 只 接收 传输 层 的 协议 提供 的 服务 。 这 意味 着 该 层 的 协议 可 以 轻易 去 除 。 只 
要 新 的 协议 可 以 使 用 传输 层 中 任意 一 个 协议 提供 的 服务 ， 这 个 协议 就 可 以 添加 到 应 用 层 上 。 
由 于 应 用 层 是 唯一 向 因特网 用 户 提供 服务 的 层 ， 应 用 层 的 灵活 性 使 得 新 的 协议 可 以 很 容 
易 地 添加 到 网 络 上 ， 如 前 所 述 ， 这 种 情况 在 因特网 的 生命 周期 内 常常 出 现 。 当 因特网 最 初创 
造 出 来 时 ， 用 户 只 能 使 用 很 少 的 应 用 协议 ， 如 今 由 于 新 协议 的 添加 已 经 变 成 常态 ， 我 们 很 难 


给 出 现 有 协议 的 具体 数目 。 


6.2.2 ”应 用 层 模式 

很 清楚 的 一 点 是 ， 当 使 用 网 络 时 我 们 需要 两 个 应 用 程序 彼此 交互 : 其 中 一 个 应 用 程序 在 
世界 上 某 处 的 一 台 计 算 机 上 运行 ， 另 一 个 应 用 程序 在 世界 上 某 处 的 另 一 台 计 算 机 上 运行 。 这 
两 个 程序 需要 通过 网 络 基础 设施 互相 发 送 消息 。 然 而 ， 我 们 还 没有 讨论 这 些 程 序 之 间 应 该 
是 何 种 关系 。 两 个 应 用 程序 都 应 能 够 请 求 和 提供 服务 ， 还 是 这 些 应 用 程序 只 需要 其 中 的 一 个 
或 另外 一 个 功能 ? 在 网 络 的 生命 周期 中 ， 应 用 程序 发 展 出 了 两 种 模式 来 解答 这 个 问题 : 客户 
机 - 服务 器 模式 和 端 到 端 模式 。 这 里 简单 介绍 这 两 种 模式 。 


1. 传统 模式 : 客户 机 - 服务 器 模式 

较为 传统 的 模式 叫 作 客户 机 - 服务 器 模式 。 这 直到 几 年 以 前 还 一 直 是 最 为 流行 的 一 种 模 
式 。 在 这 种 模式 中 ， 服 务 提供 者 是 一 个 应 用 程序 ， 叫 作 服 务 器 进程 ， 这 个 进程 一 直 运 行 ， 等 
待 另 一 个 叫 作 客户 端 进程 的 应 用 程序 通过 因特网 连接 请 求 服务 。 通 常 一 些 服务 器 进程 可 以 提 
供 某 特定 种 类 的 服务 ,但 是 向 这 些 服 务 器 进程 请 求 服务 的 用 户 会 很 多 ， 因 此 很 多 服务 器 进程 
需要 一 直 运行 ， 而 客户 端 进程 只 在 需要 时 运行 。 

虽然 客户 机 - 服务 器 模式 中 的 通信 是 在 两 个 应 用 程序 之 间 进 行 的 ， 但 每 个 应 用 程序 的 
角色 完全 不 同 ， 也 就 是 说 ， 我 们 不 能 把 客户 端 程序 当成 服务 器 程序 运行 ， 反 之 亦 然 。 图 6-11 
展示 了 一 个 客户 机 - 服务 器 通信 的 例子 ， 在 这 里 三 个 客户 机 与 同一 个 服务 器 通信 以 获得 该 服 


务 器 提供 的 服务 。 





图 6-11 客户 机 - 服务 器 模式 的 例子 


这 种 模式 的 一 个 问题 是 通信 负荷 集中 由 服务 器 承担 ， 这 说 明 服 务 器 必须 是 一 台 极 为 强大 
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的 计算 机 。 即 使 是 一 台 极 为 强大 的 计算 机 也 可 能 因为 大 量 客户 在 同一 时 间 尝 试 连接 到 服务 器 
而 过 载 。 另 外 一 个 问题 则 是 需要 服务 提供 者 愿意 接受 这 个 成 本 并 为 某 一 特定 服务 建造 一 台 足 
够 强大 的 服务 器 ， 也 就 是 说 ， 该 服务 必须 向 服务 器 回报 相应 的 某 种 收入 来 鼓励 这 样 一 种 安排 。 

一 些 传统 服务 仍然 在 使 用 这 种 模式 ， 包 括 万 维 网 (WWW) 和 它 的 超 文 本 传输 协议 
(HTTP)、 文 件 传 输 协议 (FTP)、 安 全 外 这 协议 (SSH)、 邮 件 服务 ， 等 等 。 本 章 后 面 讨论 这 
些 协议 和 应 用 。 

2. 新 模式 : 端 到 端 模式 

端 到 端 模 式 〈 通 常 缩写 为 P2P 模式 ) 是 一 个 新 的 模式 ， 这 种 模式 为 了 响应 一 些 新 应 用 的 
需求 而 形成 。 在 这 种 模式 中 ， 不 需要 一 个 一 直 运 行 并 等 待 客 户 端 进程 连接 的 服务 器 进程 。 这 
个 责任 是 在 端 与 端 之 间 共 享 的 。 一 台 与 网 络 相连 接 的 计算 机 可 以 在 一 个 时 间 段 提供 服务 又 在 
另 一 个 时 间 段 接收 服务 。 一 台 计 算 机 甚至 可 以 在 同一 时 间 提 供 和 接收 服务 。 图 6-12 展示 了 
这 种 模式 在 通信 时 的 一 个 例子 。 





图 6-12 ” 端 到 端 模 式 的 例子 


这 个 模式 完全 适用 的 领域 之 一 是 网 络 电话 。 通 过 电话 通信 确实 是 一 个 端 到 端 活动 ， 任 何 
一 方 都 没有 必要 一 直 运 行 来 等 待 另 一 方 的 呼叫 。 端 到 端 模式 可 以 使 用 的 另 一 个 领域 是 当 一 些 
计算 机 与 网 络 连接 来 互相 共享 一 些 东西 的 时 候 。 例 如 ， 当 一 个 网 络 用 户 有 一 个 需要 与 其 他 网 
络 用 户 共享 的 文件 时 ， 不 需要 将 这 个 文件 夹 变 成 服务 器 并 且 一 直 运 行 服务 器 进程 来 等 待 其 他 
用 户 的 连接 和 获得 这 个 文件 。 

虽然 端 到 端 模式 被 证 明 更 易于 扩展 并 且 在 减少 对 长 时 间 运 行 和 维护 昂贵 服务 器 的 需求 上 
更 具有 成 本 效益 ， 但 是 它 也 有 一 些 挑战 。 最 主要 的 挑战 是 安全 性 。 和 由 几 个 专属 服务 器 控制 
的 服务 相 比 ， 在 分 散 的 服务 之 间 创 造 安 全 的 通信 更 为 困难 。 另 一 个 挑战 则 是 适应 性 ， 看 起 来 
似乎 并 不 是 所 有 的 应 用 都 可 以 使 用 这 种 新 模式 。 例 如 ， 假 如 有 一 天 万 维 网 也 可 以 通过 端 到 端 
服务 实现 ， 但 并 不 是 很 多 网 络 用 户 都 可 以 准备 好 参与 的 。 


6.2.3 标准 客 忆 机 - 服务 器 应 用 


在 网 络 的 生命 周期 中 ， 发 展 出 了 几 种 客户 机 - 服务 器 应 用 程序 。 不 需要 重新 定义 它们 ， 


但 是 需要 理解 这 些 程序 的 作用 。 
本 节选 择 6 个 标准 应 用 程序 。 我 们 从 HTTP 和 万 维 网 讲 起 ， 因 为 几乎 所 有 的 网 络 用 户 都 
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使 用 它们 。 接 着 介绍 具有 高 网 络 传输 负荷 的 文件 传输 和 电子 邮件 应 用 。 然 后 解释 远程 登录 以 
及 它 是 如 何 通过 使 用 TELNET 和 SSH 协议 做 到 的 。 最 后 讨论 DNS， 所 有 应 用 程序 都 使 用 它 
来 向 对 应 的 主机 IP 地 址 映射 应 用 层 标 识 符 。 

1 万维网 和 超 文本 传输 协议 

本 节 将 介绍 万 维 网 (缩写 为 WWW 或 Web)。 然 后 讨论 超 文 本 传输 协议 (HTTP)， 以 及 
和 网 络 有 关 的 最 常用 的 客户 机 - 服务 器 应 用 程序 。 


万 维 网 
Web 是 信息 的 存储 库 ， 这 个 存储 库 中 叫 作 网 页 的 文档 分 布 在 全 世界 并 且 相 关 的 文档 者 


链接 在 一 起 。Web 的 普及 和 发 展 与 以 上 提 到 的 两 个 术语 有 关 : 分 布 式 和 链接 。 分 布 促进 了 
Web 的 发 展 ， 世 界 上 的 每 一 个 Web 服务 器 都 可 以 向 这 个 存储 库 添 加 一 个 新 网 页 并 且 告 知 所 
有 网 络 用 户 而 不 用 担心 导致 个 别 服务 器 过 载 。 链 接 使 一 个 网 页 可 以 参考 存储 在 世界 上 另外 
一 个 地 方 的 服务 器 中 的 另 一 个 网 页 。 网 页 之 间 的 链接 是 通过 一 个 叫 作 超 文本 的 概念 实现 的 ， 
这 个 概念 的 引入 发 生 在 网 络 到 来 之 前 。 这 个 想法 是 当 文档 中 出 现 到 另外 一 个 文档 的 链接 时 ， 
用 一 个 可 以 自动 检索 的 机 器 检索 系统 中 存储 的 另外 一 个 文档 。Web 将 这 个 想法 电子 化 了 : 
当 用 户 点 击 链接 时 ， 就 会 检索 到 被 链接 的 文档 。 现 在 我 们 将 为 了 描述 链接 的 文本 文档 而 创 
造 的 术语 “ 超 文本 ” 改 成 了 超 媒体 ， 来 说 明 一 个 网 页 可 以 是 文本 文档 、 图 像 、 音 频 文件 或 视 
频 文件 。 

今天 的 WWW 是 一 个 分 布 式 客户 机 - 服务 器 服务 , 在 这 个 服务 中 ， 客 户 可 以 通过 浏览 器 来 
访问 使 用 服务 器 的 服务 。 但 是 ， 提 供 的 服务 分 布 在 许多 地 方 ， 称 为 站 点 。 每 个 站 点 存储 的 一 个 
或 多 个 文档 称 为 网 页 。 然 而 ， 每 个 网 页 都 包含 到 相同 站 点 或 不 同 站 点 的 其 他 网 页 的 链接 。 换 名 
话说 ， 一 个 网 页 可 以 很 简单 也 可 以 很 复杂 。 一 个 简单 的 网 页 不 包含 到 其 他 网 页 的 链接 ， 一 个 复 
杂 的 网 页 则 拥有 一 个 或 多 个 到 其 他 网 页 的 链接 。 每 个 网 页 都 是 一 个 具有 名 称 和 地 址 的 文件 。 

假设 我 们 需要 检索 一 个 科技 文献 ， 这 个 文献 引用 了 另 一 个 文本 文件 和 一 个 较 


大 的 图 片 。 图 6-13 展示 了 这 个 情形 。 


站 后 站 后 I 






A: 原始 文档 
B: 图 片 
C; 引用 的 文本 文件 


图 6-13 例 6-1 


主要 文档 和 图 片 存储 在 同一 站 点 的 两 个 分 开 的 文件 中 (文件 A 和 文件 B); 引用 的 文本 
文件 存储 在 为 一 个 站 点 (文件 C)。 由 于 需要 处 理 3 个 不 同文 件 ， 如 果 想 看 见 整 个 文档 需要 3 
个 事务 。 第 一 个 事务 (请 求 / 响应 ) 检索 主要 文档 (文件 A) 的 副本 ， 这 个 副本 中 有 第 二 个 和 
第 三 个 文件 的 相应 引用 (指针 )。 当 检索 并 浏览 到 主要 文档 的 副本 后 ， 用 户 就 可 以 点 击 图 片 
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的 引用 并 调用 第 二 个 事务 ， 然 后 检索 图 片 的 副本 (文件 B)。 如 果 用 户 需 要 查看 引用 的 文本 
文件 的 内 容 ， 可 以 点 击 该 文件 的 引用 (指针 ) 以 调用 第 三 个 事务 并 且 检 索 文 件 C 的 副本 。 注 
意 ， 虽 然 文 件 A 和 B 都 存储 在 站 点 工 ， 但 它们 是 有 着 不 同名 称 和 地 址 的 独立 文件 。 检 索 它 
们 需要 调用 两 个 事务 。 我 们 需要 记 住 的 很 重要 的 一 点 是 ， 例 6-1 中 的 文件 A、B 和 C 都 是 独 
立 的 网 页 ， 它 们 有 独立 的 地 址 和 名 称 。 虽 然 文件 A 中 包含 文件 B 或 文件 C 的 引用 ， 但 这 并 
不 意味 着 这 些 文件 无 法 各 自 独 立地 检索 到 。 第 二 个 用 户 可 以 通过 一 个 事务 检索 文件 B。 第 三 
个 用 户 可 以 通过 一 个 事务 检索 文件 C。 

Web 客户 端 (浏览 器 ) 

各 种 各 样 的 供应 商 提供 了 能 解释 和 显示 网 页 的 商用 浏览 器 。 它 们 几乎 使 用 了 相同 的 体系 
结构 。 每 个 浏览 器 通常 由 三 部 分 构成 : 控制 器 、 客 户 端 协议 和 解释 器 。 

控制 器 接收 来 自 键盘 或 鼠标 的 输入 ， 使 用 客户 端 程序 存 取 文 档 。 在 文档 被 存 取 之 后 ， 控 
制 器 使 用 一 个 解释 器 在 屏幕 上 显示 文档 。 客 户 端 协议 可 以 是 稍 后 要 描述 的 协议 中 的 一 种 ， 如 
HTTP 或 FTP。 根 据 文 档 类 型 ， 解 释 器 可 以 是 HTML、Java 或 JavaScript。 一 些 商 业 浏览 器 
包括 Internet Explorer、Netscape Navigator 和 Firefox。 

Web 服务 器 

服务 器 存储 网 页 。 每 当 请 求 到 达 时 ， 相 应 的 文档 会 发 送 至 客户 端 。 

统一 资源 定位 符 (URL) 

作为 文件 ， 网 页 需要 唯一 的 标识 符 来 将 它 和 其 他 网 页 区 分 开 来 。 定 义 一 个 网 页 需要 3 个 
标识 符 : 主机 、 端 口 和 路 径 。 然 而 ， 在 对 网 页 进行 定义 之 前 ， 需 要 告诉 浏览 器 我 们 想 要 使 用 
的 客户 机 - 服务 器 应 用 程序 ， 这 叫 作协 议 。 这 意味 着 我 们 需要 4 个 标识 符 来 定义 网 页 ， 第 一 
个 是 用 来 得 到 网 页 的 工具 种 类 ， 剩 下 三 个 的 组 合 定义 目标 对 象 (网 页 )。 

。 协议 : 为 了 访问 网 页 需要 的 第 一 个 标识 符 是 客户 机 - 服务 器 程序 的 缩写 。 

。 主机 标识 符 : 主机 标识 符 可 以 是 服务 器 的 IP 地 址 或 服务 器 的 特定 名 称 。 

。 端口 号 : 端口 号 通常 是 为 客户 机 - 服务 器 应 用 程序 预定 义 的 16 位 整数 。 

。 路 径 : 路 径 标识 该 文件 在 基本 的 操作 系统 中 的 名 字 和 位 置 。 这 种 格式 的 标识 符 通常 由 

操作 系统 决定 。 

在 UNIX 操作 系统 中 ， 路 径 是 一 组 目录 名 跟着 文件 名 ， 在 路 径 中 用 斜 杠 把 目录 与 子 目 录 
和 文件 分 开 。 

统一 资源 定位 符 (URL) 是 为 了 把 这 4 个 部 分 结合 起 来 而 设计 的 ， 如 下 所 示 ， 它 用 3 种 
不 同 的 分 隔 符 将 4 个 部 分 分 开 : 

protocol://host/path 大 多 数 时 间 用 

protocol://host:port/path “” 当 需要 端口 号 时 使 用 

2. 超 文本 传输 协议 

超 文本 传输 协议 ( HTTP ) 是 一 个 用 来 定义 如 何 编写 客户 机 - 服务 器 程序 以 便 从 网 络 中 
检索 网 页 的 协议 。HTTP 客户 端 发 送 请 求 ， 服 务 器 返回 响应 。 服 务 器 使 用 的 端口 号 为 80， 而 
客户 机 使 用 临时 端口 号 。 


6.2.4 文件 传输 协议 


文件 传输 协议 (FTP) 是 TCP/IP 提供 的 标准 协议 ， 用 于 从 一 台 计 算 机 复制 文件 到 为 一 
台 计 算 机 。 虽 然 从 一 个 系统 到 另 一 个 系统 的 文件 传输 看 起 来 简单 直接 ， 但 有 些 问题 必须 首先 
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处 理 。 例 如 ， 两 个 系统 可 能 使 用 不 同 的 文件 命名 约定 。 两 个 系统 也 可 能 有 不 同 的 方式 表示 数 
据 。 两 个 系统 有 不 同 的 目录 结构 。 所 有 这 些 问题 都 被 FTP 使 用 非常 简单 优美 的 方法 解决 了 。 

图 6-14 显示 了 FTP 的 基本 模式 。 客 户 端 由 三 部 分 组 成 : 用 户 接 口 、 客 户 端 控制 进程 和 
客户 端 数据 传输 进程 。 服 务 器 由 两 部 分 组 成 : 服务 器 控制 进程 和 服务 器 数据 传输 进程 。 控 制 
连接 建立 在 控制 进程 间 ， 数 据 连接 建立 在 数据 传输 进程 间 。 





图 6-14 文件 传输 协议 


命令 和 数据 的 分 开 传输 使 得 FTP 效率 更 高 。 控 制 连接 使 用 非常 简单 的 通信 规则 ， 一 次 
只 需要 传输 一 行 命 令 或 一 行 啊 应 。 另 一 方面 ， 数 据 连 接 却 需要 更 为 复杂 的 规则 ， 这 是 由 于 要 


传输 的 数据 是 多 种 多 样 的 。 


两 个 连接 的 生命 周期 
FTP 中 的 两 个 连接 有 着 不 同 的 生命 周期 。 控 制 连 接 在 整个 交互 式 FTP 会 话 中 都 是 保持 


打开 的 ， 而 数据 连接 为 每 个 文件 传输 活动 打开 和 关闭 。 每 次 涉及 使 用 文件 传输 命令 时 ， 它 就 
打开 ， 文 件 传输 结束 后 ， 它 就 关闭 。 当 控制 连接 打开 时 ， 如 果 需 要 传输 多 个 文件 ， 数 据 连接 


可 以 打开 和 关闭 多 次 。 


6.2.5 ”电子 邮件 


电子 邮件 (electronic mail 或 e-mail) 允许 客户 交换 信息 。 然 而 这 个 应 用 的 本 质 却 与 其 
他 讨论 过 的 应 用 不 一 样 。 在 HTTP 或 FTP 之 类 的 应 用 中 ， 服 务 器 程序 是 一 直 运 行 的 ， 等 待 
客户 的 请 求 。 当 请 求 来 临时 ， 服 务 器 提供 服务 。 有 请 求 就 有 响应 。 但 是 这 种 情况 在 电子 邮件 
中 是 不 一 样 的 。 首 先 ， 电 子 邮 件 被 认为 是 一 个 单 向 事务 。 当 Alice 给 Bob 发 邮件 时 ， 她 可 能 
期 待 收 到 回复 ,但 是 这 不 是 一 个 指令 。Bob 可 能 回 也 可 能 不 回 。 如 果 他 确实 回复 了 ， 这 是 另 
一 个 单 向 事务 。 其 次 ， 让 Bob 运行 一 个 服务 器 程序 并 且 等 待 直到 有 人 向 他 发 邮件 既 不 可 行 
也 不 符合 逻辑 。Bob 可 能 在 他 不 使 用 时 将 计算 机 关闭 。 这 意味 着 客户 机 / 服务 器 编程 应 该 通 
过 另 一 种 途径 实现 : 使 用 一 些 中 间 计 算 机 (服务 器 )。 用 户 只 在 需要 的 时 候 运 行 客户 端 程序 ， 
然后 中 间 服 务 咒 回应 客户 机 / 服务 器 模式 ， 就 像 下 一 节 要 谈论 的 那样 。 

体系 结构 

为 了 解释 电子 邮件 的 体系 结构 ， 我 们 给 出 了 一 个 常见 的 场景 ， 如 图 6-15 所 示 。 

在 这 个 常见 的 场景 中 ，Alice 和 Bob 分 别 是 发 件 人 和 收 件 人 ， 他 们 通过 LAN 或 WAN 与 
两 个 电子 邮件 服务 器 相连 。 管 理 员 已 经 为 每 个 用 户 创建 了 一 个 邮箱 ， 用 来 存储 收 到 的 信息 。 
邮箱 是 服务 器 硬盘 的 一 部 分 ， 是 一 个 有 权限 限制 的 特殊 文件 。 只 有 邮箱 的 主人 可 以 访问 它 。 
管理 员 已 经 创建 了 一 个 接 一 个 发 送 电子 邮件 到 互联 网 的 队列 系统 (spool) 。 
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UA: 用 户 代 理 
MAA: 消息 访问 代理 
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邮件 服务 器 邮件 服务 器 
图 6-15 常见 场景 


如 图 6-15 所 示 ，Alice 发 给 Bob 一 封 简单 邮件 的 过 程 需要 9 个 不 同步 又 。Alice 和 
Bob 使 用 了 三 个 不 同 的 代理 程序 : 用 户 代理 ( UA)、 消 息 传送 代理 ( MTA) 和 消息 访问 代理 
(MAA)。 当 Alice 需要 向 Bob 发 送信 息 时 ， 她 运行 用 户 代 理 程序 ， 准 备 消息 ， 然 后 发 送 消息 
到 她 的 邮件 服务 器 。 在 Alice 处 的 邮件 服务 器 使 用 队列 来 存储 消息 ， 等 待 发 送 。 消 息 需要 通 
过 网 络 使 用 MTA 由 Alice 处 传 到 Bob 处 。 这 里 用 到 了 两 个 消息 传送 代理 : 一 个 客户 机 和 一 
个 服务 器 。 就 像 网 络 上 的 其 他 客户 机 - 服务 器 程序 一 样 ， 服 务 器 需要 一 直 运 行 ， 因 为 它 不 知 
道 何 时 会 有 客户 要 求 连接 。 另 一 方面 ， 当 队列 中 有 一 个 邮件 将 要 发 送 时 ， 客 户 机 可 以 被 系统 
触发 。 在 Bob 处 的 用 户 代理 允许 Bob 阅读 收 到 的 邮件 。 然 后 Bob 使 用 一 个 MAA 客户 机 从 
第 二 个 服务 器 上 运行 的 MAA 服务 器 检索 邮件 。 

Bob 需要 男 一 组 客户 机 - 服务 器 程序 : 消息 访问 程序 。 这 是 因为 MTA 客户 机 - 服务 器 
程序 是 推 入 程序 : 客户 机 将 消息 推 人 (上载 ) 服务 器 。Bob 需要 一 个 拉 出 程序 : 客户 机 需要 
从 服务 器 拉 出 (下载) 消息 。 很 快 我 们 会 讨论 有 关 MAA 的 更 多 内 容 。 


6.2.6 TELNET 


服务 器 程序 可 以 为 相应 的 客户 机 程序 提供 特定 的 服务 。 例 如 ，FTP 服务 器 使 FTP 客户 
可 以 在 服务 器 上 存 取 文 件 。 但 是 不 可 能 为 我 们 需要 的 每 一 种 服务 都 编写 一 对 客户 机 / 服务 
器 ， 服 务 器 的 数量 很 快 就 会 变 得 难处 理 。 这 个 想法 是 不 现实 的 。 另 一 个 解决 方法 是 为 一 系列 
常用 场景 设置 一 个 特定 的 客户 机 /服务 器 程序 ， 但 是 使 用 一 些 一 般 性 的 客户 机 / 服务 器 程序 ， 
这 样 的 程序 允许 用 户 在 客户 机 站 点 登录 服务 器 计算 机 ， 并 且 使 用 该 计算 机 上 可 用 的 服务 。 例 
如 ， 如 果 一 个 学 生 想 在 大 学 机 房 使 用 Java 编译 器 程序 ，Java 编译 器 客户 机 和 编译 器 服务 器 
是 不 必要 的 。 这 个 学 生 只 需要 利用 一 个 客户 端 程序 登录 到 大 学 服务 器 ， 然 后 使 用 大 学 的 编译 
器 程序 。 我 们 把 这 些 一 般 性 的 客户 机 / 服务 器 对 称 为 远程 登录 应 用 。 

TELNET 是 终端 网 络 (TErminaL NETwork) 的 缩写 ， 是 早期 的 远程 登录 协议 之 一 。 虽 然 
TELNET 要 求 登 录 名 和 密码 ， 但 是 面 对 黑 客 行为 时 它 是 很 脆弱 的 ， 因 为 它 以 明文 形式 (不 是 密 
文 ) 发 送 所 有 数据 ， 包 括 密码 。 黑 客 可 以 窃听 并 且 得 到 登录 名 和 密码 。 由 于 这 个 安全 问题 ， 
TELNET 的 使 用 已 经 由 于 另 一 个 协议 〈 安 全 外 壳 协 议 ) 的 使 用 而 减少 。 下 一 节 讨 论 安全 外 壳 协 议 。 
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6.2.7 ”安全 外 壳 

虽然 现今 安全 外 壳 (SSH) 是 一 个 可 以 用 作 多 个 目的 (如 远程 登录 和 文件 传输 ) 的 安全 
应 用 程序 ， 但 是 它 在 最 初 是 为 了 代替 TELNET 而 设计 的 。SSH 有 两 个 完全 不 兼容 的 版 本 : 
SSH-1 和 SSH-2。 第 一 个 版 本 (SSH-1 ) 现在 由 于 其 中 的 安全 漏洞 而 弃 用 ， 当 前 版 本 是 SSH-2。 


6.2.8 域名 系统 

我 们 讨论 的 最 后 一 个 客户 机 - 服务 器 应 用 程序 是 域名 系统 (DNS)， 这 个 程序 是 为 了 帮 
助 其 他 应 用 程序 而 设计 的 。 为 了 确认 一 个 实体 ，TCP/IP 协议 族 使 用 唯一 定义 了 该 主机 和 网 
络 之 间 连 接 的 也 地址 。 但 是 ， 人 们 更 愿意 使 用 名 字 而 不 是 数字 化 的 地 址 。 因 此 ， 网 络 需要 
有 一 个 可 以 将 名 称 映 射 到 地 址 的 目录 系统 。 这 和 电话 网 络 是 相似 的 。 电 话 网 络 为 了 使 用 电话 
号 码 而 非 姓 名 而 设计 。 人 们 可 以 保存 一 份 私人 文件 来 将 名 字 映 射 到 相应 电话 号 码 ， 也 可 以 直 
接 通过 电话 秒 来 打 电 话 。 

由 于 如 今 的 网 络 如 此 巨大 ， 一 个 中 央 目 录 系统 无 法 承担 所 有 的 映射 工作 。 除 此 之 外 ， 如 
果 中 央 计 算 机 出 故障 了 ， 那 么 整个 通信 和 网 络 就 会 凑 痪 。 更 好 的 解决 方法 是 将 信息 分 布 到 世界 上 
的 很 多 计算 机 上 。 通 过 这 个 方法 ， 需 要 进行 映射 的 计算 机 可 以 与 保存 必要 信息 的 最 近 的 一 台 计 
算 机 联系 。 图 6-16 展示 了 TCP/P 协议 族 如 何 利用 一 个 域名 系统 客户 端 和 一 个 域名 系统 服务 器 
来 将 一 个 名 称 映 射 到 一 个 地 址 上 。 用 户 想 使 用 文件 传输 客户 端 访 问 远程 主机 上 运行 的 相应 文 
件 传输 服务 器 。 用 户 只 知道 文件 传输 服务 器 的 名 字 ， 比 如 afilesource.com。 但 是 TCP/IP 协议 
族 需 要 文件 传输 服务 器 的 IP 地 址 来 进行 连接 。 下 面 6 个 步骤 将 主机 名 映射 到 IP 地 址 上 : 

1 ) 用 户 将 主机 名 传递 给 文件 传输 客户 端 。 

2 ) 文件 传输 客户 端 将 主机 名 传递 给 域名 系统 客户 端 。 

3 ) 每 台 计 算 机 在 启动 之 后 得 知 一 台 域 名 系统 服务 器 的 地 址 。 域 名 系统 客户 端 发 送 消息 
和 查询 给 域名 系统 服务 器 ， 查 询 利用 已 知 的 域名 系统 服务 器 的 IP 地 址 命名 文件 传输 服务 器 。 

4 ) 域名 系统 服务 器 给 出 需要 的 文件 传输 服务 器 的 IP 地 址 。 

5 ) 域名 系统 客户 端 将 IP 地 址 传输 给 文件 传输 服务 器 。 

6 ) 文件 传输 客户 端 现 在 使 用 得 到 的 IP 地 址 访问 文件 传输 服务 器 。 





图 6-16 ”DNS 的 用 法 


1. 命名 空间 
确切 地 说 ， 给 机 器 指定 的 名 称 必 须 从 一 个 对 于 名 称 和 JP 地 址 之 间 的 绑 定 有 完全 控制 权 


计 第 枯 网 经 和 和 因 和 于 网 107 


的 命名 空间 中 选择 。 换 句 话 说， 因为 地 址 唯一 ， 所 以 名 称 也 应 当 是 唯一 的 。 命 名 空间 可 以 把 
每 一 个 地 址 映射 到 一 个 唯一 的 名 称 上 ， 这 些 名 称 通常 按照 分 层 进行 组 织 。 在 分 层 的 命名 空间 
内 ， 每 个 名 称 由 几 部 分 组 成 。 第 一 部 分 定义 组 织 的 本 质 ， 第 二 部 分 定义 组 织 的 名 称 ， 第 三 部 
分 定义 组 织 中 的 部 门 ， 等 等 。 在 这 里 ,命名 空间 的 分 配 和 控制 权 可 以 是 分 散 的 。 中 心机 构 可 
以 分 配 一 部 分 名 称 ， 这 些 名 称 对 组 织 的 本 质 和 名 称 进 行 定义 。 名 称 的 剩 下 部 分 则 由 组 织 本 身 
给 出 。 组 织 可 以 通过 向 名 称 添加 后 级 (或 前 级) 来 定义 它 的 主机 或 资源 。 组 织 在 进行 管理 时 
不 需要 因为 它 为 主机 选择 的 前 级 为 男 一 组 织 使 用 而 担心 ， 因 为 即使 一 部 分 主机 地 址 相同 ， 整 
个 主机 地 址 也 是 不 一 样 的 。 例 如 ， 假 设 两 个 组 织 都 把 各 自 的 一 台 计算 机 称 为 caesar。 中 心机 
构 给 第 一 个 组 织 的 名 称 比 如 说 是 first.com， 给 第 二 个 组 织 的 名 称 则 是 second.com。 当 两 个 组 
织 都 把 名 称 caesar 添加 到 已 经 被 指定 的 名 称 上 时 ， 最 终结 果 是 两 个 不 同 的 名 称 : caesar,first. 
com 和 ceasar.second.com。 名 称 是 唯一 的 。 

2. 网 络 中 的 域名 系统 

DNS 是 一 个 可 用 于 不 同 平台 的 协议 。 在 网 络 中 ， 域 名 空间 ( 树 ) 最 初 分 为 三 个 不 同 部 
分 : 一 般 域 、 国 家 域 和 反 向 域 。 然 而 ， 由 于 网 络 的 快速 发 展 ， 跟 踪 反 向 域 变 得 极为 困难 ， 这 
里 反 辐 域 的 作用 是 在 设置 卫 地 址 时 找到 该 主机 的 名 称 。 反 向 域 现在 已 经 不 再 使 用 ( 见 RFC 
3425 )， 因 此 我 们 的 注意 力 集 中 在 前 两 个 域 上 。 

一 般 域 

一 般 域 根据 注册 主机 的 一 般 行为 对 它们 进行 定义 。 树 上 的 每 一 个 节点 定义 一 个 域 ， 这 些 
节点 是 域名 空间 数据 库 的 索引 ( 见 图 6-17 )。 通 过 这 个 树 ， 我 们 可 以 看 到 在 一 般 域 部 分 的 第 
一 层 允 许 14 个 可 能 的 标签 。 这 些 标签 描述 了 表 6-1 中 陈列 的 组 织 类 型 。 

根 层 


a pc0OV | info int | mil ee nanel met org pro 


[e) 


和 b 
RF I . 
el uci DE 
2 


uci.edu. 地基 索 引 





图 6-17 一 般 域 
表 6-1 一 般 域 标签 
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国家 域 
国家 域 部 分 使 用 两 个 字符 组 成 的 国家 缩写 (例如 ，us 是 United States 的 缩写 )。 第 二 个 标 
签 可 以 是 编制 的 ， 也 可 以 是 更 特定 的 国 别 根 层 
称号 。 例 如 ， 美 国 用 州 的 缩写 作为 国 别 缩 
写 us 的 细 分 (例如 ，ca.us)。 图 6-18 展示 
了 国家 域 部 分 。 地 址 uci.ca.us 可 以 翻译 为 
美国 加 利 福 尼 亚 州 的 加 州 大 学 欧文 分 校 。 


6.2.9 ” 端 到 端 模式 


本 章 前 面 讨 论 了 客户 机 -服务 器 模 图 6.18 国家 域 
式 。 端 到 端 文件 共享 的 第 一 个 范例 可 以 追 
漳 到 1987 年 12 月， 韦 恩 . 贝尔 创造 了 WWIV 网 一 一 WWIV (第 四 次 世界 大 战 ) 公告 栏 软 
件 的 网 络 组 件 。1999 年 7 月， 伊 恩 . 克拉 克 设 计 了 新 飞 网 (Freenet) 一 个 分 散 且 抗 审查 
的 分 布 式 数据 存储 ， 旨 在 通过 一 个 端 到 端 网 络 为 言论 自由 提供 具有 匿名 性 的 强 有 力 的 保障 。 

端 到 端 网 络 随 着 肖 恩 ， 范 宁 创造 的 在 线 音乐 文件 分 享 服务 Napster ( 1999 一 2001 ) 逐 
渐 受 到 欢迎 。 虽 然 用 户 自 由 复制 和 传播 音乐 文件 的 行为 引起 了 对 Napster 的 一 个 侵权 诉 
讼 并 且 导 致 了 该 服务 的 关闭 ， 但 它 为 后 来 的 端 到 端 文件 分 布 模型 英 定 了 基础 。Gnutella 
首次 于 2000 年 3 月 发 布 。 紧 随 其 后 ，(Kazaa 使 用 的 ) 快 道 协议 (FastTrack) 、BT 下 载 
(BitTorrent)、WinMX 和 吉 牛 网 (GNUnet) 也 各 自在 2001 年 3 月 、4 月 、5 月 和 11 月 相继 
发 布 。 | 
准备 好 共享 资源 的 网 络 用 户 成 为 同位 体 (peer) 并 逐渐 构成 网 络 。 当 网 络 中 的 一 个 同位 
体 有 可 共享 的 文件 (例如 ， 一 个 音频 或 视频 文件 ) 时 ， 这 个 文件 对 于 其 他 同位 体 而 言 是 可 获 
得 的 。 感 兴趣 的 同位 体 可 以 与 存储 该 文件 的 计算 机 连接 并 下 载 这 个 文件 。 在 一 个 同位 体 下载 
这 个 文件 之 后 ， 这 个 文件 可 用 于 其 他 同位 体 的 下 载 。 随 着 更 多 同位 体 加 入 和 下 载 该 文件 ， 这 
个 文件 的 更 多 副本 就 会 提供 到 组 中 。 由 于 同位 体 列 表 可 能 增长 也 可 能 收缩 ， 因 此 问题 是 该 
模式 应 当 如 何 跟踪 忠实 的 同位 体 和 文件 位 置 。 为 了 回答 这 个 问题 ; 我 们 需要 把 端 到 端 ( P2P) 
模式 分 成 两 类 : 集中 的 和 分 散 的 。 


1. 集中 网 络 
在 一 个 集中 的 端 到 端 网 络 中 ， 目 录 系 统 列 出 同位 体 和 它们 提供 了 什么 以 使 用 客户 机 - 服 


务 器 模式 ， 但 是 文件 的 存储 和 下 载 都 使 用 端 到 端 模式 完成 。 由 于 这 个 原因 ， 集 中 P2P 网 络 
有 时 也 被 称 为 混合 P2P 网 络 。Napster 就 是 一 个 集中 P2P 的 例子 。 在 这 种 网 络 中 ， 一 个 同位 
体 先 通过 一 个 中 央 服 务 器 注册 ， 然 后 同位 体 提 供 它 的 IP 地 址 和 它 准 备 共 享 的 文件 列表 。 为 
了 防止 系统 衣 溃 ，Napster 为 此 使 用 了 多 个 服务 器 ， 虽 然 只 在 图 6-18 中 展示 了 一 个 。 

为 了 寻找 一 个 特定 文件 ， 同 位 体 向 主 服务 器 发 送 一 个 查询 要 求 。 服 务 器 在 它 的 目录 中 搜 
索 并 给 出 存 有 该 文件 副本 的 节点 的 卫 地 址 。 同 位 体 连 接 这 些 节 点 之 一 并 下 载 文件 。 随 着 节 
点 加 入 和 离开 同位 体 ， 这 个 目录 一 直 在 更 新 。 

集中 网 络 使 目录 的 维护 得 到 简化 ， 但 是 也 造成 一 些 障 碍 。 访 问 目录 可 能 产生 巨大 的 流量 
并 使 系统 变 慢 。 这 些 中 心服 务 器 很 容易 受到 攻击 ， 如 果 它 们 全 都 出 现 故障 ， 整 个 系统 就 会 售 
机 。 因 此 Napster 的 中 心 组 件 最 终 要 为 其 版 权 败诉 以 及 最 终 在 2001 年 7 月 关闭 负责 。New 
Napster 由 罗 西 欧 (Roxio) 于 2003 年 带 回 ，Napster 2 现在 是 一 个 合法 的 付费 音乐 站 点 。 
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2. 分 散 网 络 

分 散 P2P 网 络 不 依赖 于 集中 目录 系统 。 在 这 个 模型 中 ， 同 位 体 组 织 形 成 一 个 在 物理 网 
络 之 上 的 逻辑 网 络 ， 称 为 重 登 网络。 基于 重 琶 网 络 中 节点 之 间 的 连接 方式 ， 分 散 P2P 网 络 
分 成 结构 化 的 和 未 结构 化 的 两 大 类 。 

在 一 个 未 结构 化 的 P2P 网 络 中 ， 节 点 随机 地 连 在 一 起 。 在 未 结构 化 的 P2P 中 进行 搜索 
不 是 很 有 效 ， 因 为 寻找 一 个 文件 的 查询 涌 人 网 络 并 造成 巨大 的 流量 ， 即 使 这 样 这 个 查询 请 求 
也 不 一 定 得 到 解决 。 这 种 网 络 的 两 个 例子 是 吉 牛 网 ( Gnutella) 和 新 飞 网 ( Freenet)。 我 们 下 
面 将 以 吉 牛 网 为 例 。 

结构 化 的 网 络 使 用 一 组 预 设 的 规则 来 链接 节点 ， 这 样 一 个 查询 就 可 以 有 效 且 高 效 地 解 
决 。 为 了 达到 这 个 目的 ， 最 常用 的 技术 是 分 布 式 散 列 表 ( DHT)。 很 多 应 用 都 使 用 了 DHT， 
包括 分 布 式 数 据 结构 (DDS)、 内 容 分 布 式 系统 (CDS)、 域 名 系统 (DNS) 和 了 2P 文件 共享 。 
一 个 使 用 DHT 的 常用 P2P 文件 共享 协议 是 BT 下载。 我 们 将 在 下 一 节 把 DHT 作为 一 个 既 可 
以 在 结构 化 P2P 网 络 也 可 以 在 其 他 系统 中 使 用 的 技术 单独 讨论 。 


6.3 ”传输 层 

TCP/IP 协议 族 中 的 传输 层 位 于 应 用 层 和 网 络 层 之 间 ， 它 从 网 络 层 接收 服务 并 且 为 应 用 

层 提供 服务 。 传 输 层 作为 一 个 客户 程序 和 服务 器 程序 之 间 的 联络 ， 是 一 个 进程 间 连 接 。 传 输 

层 是 TCP/IP 协议 族 的 核心 部 分 ， 它 是 一 个 在 网 络 中 从 一 点 向 另 一 点 进行 数据 传输 的 端 与 端 
之 间 的 逻辑 媒介 。 图 6-19 展示 了 人 逻辑 连接 的 思想 。 
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这 幅 图 展示 的 场景 和 我 们 用 在 应 用 层 的 是 相同 的 。Alice 在 Sky Research 科研 公司 的 
主机 和 Bob 在 Scientific Books 公司 的 主机 在 传输 层 建 立 了 一 个 逻辑 连接 。 这 两 个 公司 在 计 
算 机 传输 层 通 信 ， 就 像 在 它们 之 间 有 一 个 真正 的 连接 一 样 。 图 6-19 显示 了 只 有 两 个 端 系统 
(Alice 的 和 Bob 的 计算 机 ) 在 使 用 传输 层 服 务 ， 所 有 的 中 间 路 由 器 都 只 使 用 了 前 三 层 。 


6.3.1 传输 层 服 务 

本 节 讨 论 传输 层 可 以 提供 的 服务 ， 下 一 节 讨 论 几 种 传输 层 协议 。 

1. 进程 间 通 信 

传输 层 的 第 一 个 责任 是 提供 进程 间 通信 。 进 程 是 使 用 传输 层 服 务 的 应 用 层 实 体 (运行 中 
的 程序 )。 


网 络 层 (在 下 一 节 介 绍 ) 负责 在 计算 机 层面 的 通信 (主机 间 通 信 )。 网 络 层 协议 只 能 将 消 
息 传 输 到 目的 计算 机 。 然 而 ， 这 是 一 个 不 完整 的 传递 ， 这 个 消息 仍然 需要 被 传递 给 正确 的 进 
程 。 这 就 是 传输 层 协议 的 工作 ， 它 的 责任 是 将 消息 送 抵 相应 的 进程 。 图 6-20 显示 了 网 络 层 
和 传输 层 的 域 。 





图 6-20 ”网 络 层 与 传输 层 


2. 地 址 : 端口 号 

虽然 有 几 种 办 法 来 完成 进程 间 通信 ， 但 最 常用 的 还 是 通过 客户 机 - 服务 器 模式 (之 前 
介绍 过 )。 在 主机 上 的 进程 叫 作 客户 程序 ， 客 户 程序 需要 来 自 通常 运行 在 远程 主机 上 的 进 
程 提 供 的 服务 ， 这 个 运行 在 远程 主机 上 的 进程 叫 作 服务 器 程序 。 这 两 个 进程 (客户 和 服务 
器 程序 ) 有 着 相同 的 名 称 。 例 如 ， 为 了 从 一 个 远程 机 器 上 得 到 日 期 和 时 间 ， 我 们 需要 一 个 
daytime 客户 程序 在 本 地 主机 上 运行 和 一 个 daytime 服务 器 程序 在 远程 机 器 上 运行 。 一 个 远 
程 计算 机 可 以 同时 运行 多 个 服务 器 程序 ， 就 像 一 个 或 多 个 客户 程序 可 以 同时 在 多 个 本 地 计 
算 机 上 运行 一 样 。 为 了 通信 ， 我 们 必须 定义 本 地 主机 、 本 地 进程 、 远 程 主机 和 远程 进程 。 
本 地 主机 和 远程 主机 用 IP 地 址 进行 定义 (在 下 一 节 讨 论 )。 为 了 定义 这 些 进 程 ， 我 们 需要 
第 二 个 标识 符 ， 称 为 端口 号 。 在 TCP/IP 协议 族 中 ， 端 口号 是 0 和 65 535 (16 位 ) 之 间 的 
整数 。 

用 来 定义 客户 程序 的 端口 号 叫 作 临 时 端口 号 。 临 时 这 个 词 的 意思 是 短命 的 ， 用 在 这 里 是 
因为 客户 程序 的 使 用 寿命 通常 很 短 。 临 时 端口 号 建议 使 用 大 于 1023 的 数 ， 这 样 一 些 客户 / 
服务 器 程序 才能 正常 运行 。 服 务 器 程序 也 必须 定义 一 个 端口 号 。 然 而 ， 这 个 端口 号 不 可 以 随 
机 选择 。TCP/IP 协议 族 已 经 决定 给 服务 器 使 用 通用 端口 号 ， 这 些 端口 号 被 称 为 知名 端口 号 。 
每 一 个 客户 进程 知道 相应 服务 器 进程 的 知名 端口 号 。 例 如 ， 当 前 面谈 到 的 daytime 客户 进程 
用 临时 端口 号 52000 来 标识 自己 时 ，daytime 服务 器 进程 必须 使 用 知名 端口 号 13。 图 6-21 
展示 了 这 个 概念 。 
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图 6-21 端口 号 


6.3.2 ”传输 层 协 议 
虽然 因特网 使 用 了 一 些 传输 层 协议 , 但 在 本 书 中 我 们 只 讨论 两 种 : UDP (用 户 数 据 报 协 


议 ) 和 TCP (传输 控制 协议 )。 

1. 用 户 数据 报 协 议 

用 尸 数据 报 协 议 (UDP) 是 不 可 靠 的 无 连接 传输 协议 。 它 除了 提供 进程 间 通 信 而 不 是 主 
机 间 通 信 以 外 ， 没 有 向 网 络 层 服务 添加 任何 东西 。 如 果 UDP 这 么 无 能 为 力 ， 为 什么 一 个 进 
程 会 想 要 使 用 它 呢 ? 这 个 缺点 同时 也 是 它 的 优点 。UDP 是 一 个 极 简 单 同 时 开销 最 少 的 协议 。 
如 果 一 个 进程 想 要 发 送 一 条 短 的 消息 上 且 不 关心 可 靠 性 ， 那 么 就 可 以 使 用 UDP。 通 过 UDP 发 
送 一 条 短 的 消息 比 用 TCP 发 送 造 成 发 送 者 和 接收 者 之 间 的 互动 要 少 得 多 。 


用 户 数 据 报 
UDP 数据 包 ， 也 叫 作 用 户 数据 报 ， 有 一 个 固定 大 小 为 8 字 节 的 头 。 图 6-22 展示 了 用 户 
数据 报 的 格式 。 然 而 ， 由 于 UDP 用户 数据 8 到 65 535 字 节 
报 是 存储 在 总 长 度 为 65 535 字 节 的 IP 数据 _ 8 字 节 _. 
报 中 的 ， 所 以 其 整体 长 度 会 比较 短 。 位 传输 的 方向 
2. 传输 控制 协议 图 6-22 用 户 数据 报 的 数据 包 格 式 


传输 控制 协议 (TCP) 是 一 个 面向 连接 
的 可 靠 协议 。 它 明确 地 定义 了 连接 设施 、 数 据 传 输 和 连接 拆 印 段 以 提供 面向 连接 的 服务 。 这 
里 面向 连接 的 服务 指 的 是 在 (来 自 应 用 层 的 ) 同一 消息 中 的 所 有 数据 包 (有 段 ) 之 间 有 连接 ( 关 
联 )。TCP 使 用 序列 号 来 定义 段 的 顺序 。 序 列 号 与 每 一 段 的 字 节 数 有 关 。 比 如 在 一 个 6000 字 
节 的 消息 中 ， 第 一 段 的 序列 号 是 0， 第 二 段 的 序列 号 是 2000, 第 三 段 的 序列 号 是 4000 (实际 
过 程 更 复杂 ， 我 们 尝试 对 其 进行 了 简化 )。 这 样 ， 如 果 一 段 丢失 了 ， 接 收 者 会 持 有 另外 两 段 
直到 发 送 者 重 置 丢失 的 那 段 。 


段 
在 传输 层 ，TCP 将 一 些 字 节 组 合成 一 个 叫 作 段 的 数据 包 。TCP 在 每 一 段 之 前 加 上 一 个 


头 (目的 是 方便 控制 )， 并 且 将 这 些 段 发 送 至 网 络 层 进行 传输 。 这 些 段 都 封装 在 IP 数据 报 里 ， 
并 如 图 6-23 所 示 进 行 传输 。 





20 到 60 字 节 
一 


图 6-23 TCP 段 





位 传输 的 方向 


6.4 网 络 层 
TCP/IP 协议 族 中 的 网 络 层 负责 源 到 目的 地 (计算 机 到 计算 机 或 主机 到 主机 ) 的 消息 发 


RR 


送 。 图 6-24 展示 了 假设 Alice 和 Bob 的 计算 机 只 有 一 条 路 径 相连 时 ， 它 们 在 网 络 层 的 通信 。 
前 两 节 使 用 同样 的 场景 分 别 介 绍 了 应 用 层 和 传输 层 的 通信 。 
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图 6-24 网络 层 的 通信 


如 图 6-24 所 示 ， 源 主机 、 目 的 主机 和 路 径 中 的 所 有 路 由 器 (R2、R4、R5 和 R7) 都 涉 
及 网 络 层 。 在 源 主 机 ( Alice) 处 ， 网 络 层 从 传输 层 接收 了 一 个 数据 包 ， 它 将 数据 包 封装 在 一 
个 数据 报 中 ， 并 且 发 送 至 数据 链 路 层 。 在 目的 主机 (Bob) 处 ， 这 个 数据 报 被 解除 封装 ， 取 
出 数据 包 并 发 送 至 相应 的 传输 层 。 虽 然 TCP/IP 协议 族 的 全 部 五 层 之 中 都 涉及 了 源 主 机 和 目 
的 主机 ， 但 如 果 只 为 数据 包 规 定 路 线 ， 那 么 路 由 器 只 用 到 三 层 。 然 而 ， 为 了 进行 控制 会 需要 
传输 层 和 应 用 层 。 路 径 中 的 路 由 器 通常 与 两 个 数据 链 路 层 和 两 个 物理 层 同时 展示 ， 因 为 它 从 
一 个 网 络 接收 数据 包 ， 然 后 将 该 数据 包 传递 至 另 一 个 网 络 。 


6.4.1 网 络 层 提 供 的 服务 
网 路 层 在 传输 层 的 下 面 ， 这 就 意味 着 网 络 层 要 向 传输 层 提供 服务 。 我 们 将 在 下 面 讨论 这 


个 服务 的 几 个 方面 。 


1. 打包 
网 络 层 的 第 一 个 责任 就 是 定义 打包 : 在 源 主机 的 网 络 层 数据 包 中 封装 有 效 负荷 (从 上 
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一 层 接收 的 数据 )， 并 且 从 来 自 目的 主机 网 络 层 的 数据 包 中 解除 有 效 负荷 的 封装 。 换 句 话 说 ， 
网 络 层 的 一 个 责任 是 将 有 效 负荷 不 加 改动 地 从 源 送 到 目的 地 。 网 络 层 的 服务 就 是 一 个 邮局 式 
的 传递 者 ， 它 负责 将 数据 包 从 发 送 者 送 至 接收 者 ， 同 时 保证 数据 包 的 内 容 不 被 改变 或 使 用 。 
如 图 6-25 所 示 ， 这 通过 三 个 步骤 完成 。 


注意 : 
传输 层 的 有 效 负荷 可 能 会 变 成 几 个 网 络 层 的 数据 包 。 
发 送 者 





图 6-25 在 网 络 层 打包 


1 ) 源 网 络 层 协议 从 传输 层 协议 接收 数据 包 ， 添 加 包含 源 地 址 和 目的 地 址 以 及 其 他 网 络 
层 协议 所 需 信息 的 头 。 

2 ) 网 络 层 协议 在 逻辑 上 将 该 数据 包 传递 至 目的 地 处 的 网 络 层 协 议 。 

3 ) 目标 主机 接收 网 络 层 数据 包 ， 解 除 有 效 负 荷 的 封装 并 将 其 传输 至 上 一 层 协议 。 

如 果 在 源 主 机 或 路 径 中 的 路 由 器 处 时 数据 包 为 碎片 状 ， 网 络 层 有 责任 等 待 直到 所 有 碎片 
到 达 ， 对 它们 重新 组 合并 发 送 至 上 一 层 协 议 。 


”传输 层 的 有 效 负荷 可 以 封装 在 几 个 网 络 层 数据 包 中 。 ee 

2. 数据 包 传递 

网 络 层 的 数据 包 传 递 是 无 连接 且 不 可 靠 的 。 接 下 来 我 们 简单 讨论 这 两 个 概念 。 

不 可 靠 传递 

在 网 络 层 传递 的 数据 包 是 不 可 靠 的 ， 这 意味 着 这 些 数 据 包 可 能 损毁 、 丢 失 或 者 重复 。 换 
名 话说 ， 网 络 层 提供 的 是 尽力 而 为 的 传输 ， 它 不 能 保证 这 个 数据 包 如 我 们 所 期 待 的 那样 到 达 
目的 地 。 这 个 服务 和 我 们 在 邮局 寄 一 封 平 信 时 的 情况 是 一 样 的 。 不 管 是 邮局 还 是 网 络 层 ， 这 
都 可 以 通过 成 本 来 进行 解释 。 如 果 我 们 需要 邮局 提供 保证 ， 成 本 会 更 大 一 些 (比如 挂号 信 )。 
如 果 我 们 希望 网 络 层 提供 保证 ， 这 个 数据 包 的 传递 就 会 被 延迟 。 在 每 个 路 由 器 和 目的 地 处 的 
每 个 数据 包 都 需要 进行 检查 ， 如 果 出 现 损毁 情况 则 需要 重新 发 送 。 检 查 丢 失 的 数据 包 甚至 成 
本 更 大 。 是 否 这 样 就 意味 着 我 们 通过 网 络 传送 的 消息 是 不 可 靠 的 呢 ? 答案 是 ， 我 们 要 通过 
使 用 传输 层 协 议 中 的 TCP 才能 保证 消息 没有 损毁 。 如 果 在 传输 层 的 一 个 有 效 负荷 (由 于 数 
据 链 路 层 的 不 可 靠 传递 ) 损毁 了 ，TCP 会 丢弃 这 个 数据 包 并 且 要 求 重新 发 送 。 这 在 前 一 节 提 
1 

无 连接 传递 

网 络 层 的 传递 也 是 无 连接 的 ， 但 是 这 里 的 无 连接 不 是 说 发 送 者 和 接收 者 之 间 没 有 物 
理 连接 ， 而 是 说 网 络 层 对 每 个 数据 包 的 处 理 是 单独 的 (就 像 邮局 对 待 信件 的 那 种 方式 )。 
换 句 话说 ， 属 于 相同 传输 层 有 效 负荷 的 数据 包 之 间 是 没有 联系 的 。 如 果 一 个 传输 层 数 据 
包 由 4 个 网 络 层 数据 包 构 成 ， 那 么 无 法 保证 这 4 个 数据 包 到 达 的 顺序 与 它们 发 送 的 顺序 
相同 ， 这 是 由 于 每 个 数据 包 都 可 能 依照 不 同 的 路 径 到 达 目 的 地 。 图 6-26 展示 了 这 个 问题 


的 原因 。 
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图 6-26 不 同 的 数据 包 传 递 路 径 


一 个 传输 层 数据 包 分 成 了 4 个 网 络 层 数据 包 ， 它 们 按 顺 序 发 出 〈1, 2, 3, 4 )， 但 是 收 到 
时 它们 的 顺序 是 乱 的 (2, 4, 3, 1 )。 目 的 地 的 传输 层 负 责 等 待 和 接收 所 有 数据 包 ， 再 将 它们 
组 合 在 一 起 并 传送 至 应 用 层 。 


3. 路 由 
网 络 层 有 一 个 和 其 他 层 一 样 重要 的 职责 就 是 路 由 。 网 络 层 负责 将 数据 包 从 它 的 源 传送 到 


目的 地 。 物 理 网 络 是 网 络 (LAN 和 WAN) 和 连接 这 些 网 络 的 路 由 器 的 集合 ， 这 意味 着 从 源 
到 目的 地 有 不 止 一 条 路 线 。 网 络 层 的 责任 是 在 这 些 可 能 的 路 线 中 找到 最 优 路 线 ， 它 需要 有 一 
些 特定 的 策略 来 定义 最 优 路 线 。 在 现在 的 网 络 中 ， 这 需要 通过 在 数据 包 到 达 时 运行 一 些 路 由 
协议 来 帮助 多 个 路 由 器 协调 它们 对 于 周边 的 知识 并 且 提 出 一 致 的 路 由 表 来 实现 。 


6.4.2 网络 层 协议 


虽然 在 网 络 层 有 很 多 协议 , 但 最 主要 的 协议 叫 作 网 际 协议 (IP)。 其 他 协议 都 是 辅助 协 
以 ， 帮 助 IP 完成 它 的 职责 。 如 今 有 两 类 网 络 协议 正在 投入 使 用 : IPv4 和 IPv6。 我 们 将 在 下 
面 分 别 讨论 。 

1. 第 4 版 网 际 协议 (IPv4 ) 

现在 大 多 数 系统 都 使 用 第 4 版 网 际 协议 (IPv4 )， 但 是 这 将 在 未 来 改变 ， 因 为 该 协议 的 
地 址 空间 和 数据 包 格 式 较 小 (以 及 其 他 原因 )。 

IPv4 地 址 

在 TCP/IP 协议 族 的 IPv4 层 中 用 来 标记 每 个 设备 和 互联 网 之 间 的 连接 的 标识 符 叫 作 网 络 
地 址 或 IP 地 址 。IPv4 地 址 是 一 种 32 位 的 地 址 ， 这 种 地 址 唯一 但 又 通用 地 定义 了 主机 或 路 由 
器 与 网 络 之 间 的 连接 。IP 地 址 是 连接 的 地 址 而 非 主 机 或 路 由 器 的 地 址 ， 因 为 如 果 这 个 设备 移 
动 到 了 男 外 一 个 网 络 中 ， 它 的 IP 地址 可 能 会 改变 。IPv4 地 址 是 独一无二 的 ， 因 为 每 个 地 址 
定义 一 个 且 只 有 一 个 与 网 络 之 间 的 连接 。 如 果 一 个 设备 (例如 路 由 器 ) 有 多 个 网 络 连接 ， 那 
么 它 就 有 多 个 IPv4 地 址 。IPv4 地 址 也 是 通用 的 ， 因 为 这 个 地 址 系统 必须 被 所 有 想 要 连接 到 
网 络 的 主机 接收 。 

有 三 种 较 普 遍 的 表示 法 来 表现 一 个 IPv4 地 址 : 二 进 制 表 示 法 (以 2 为 底 )、 带 点 的 十 进 
制 表示 法 (以 256 为 底 ) 和 十 六 进 制 表 示 法 (以 16 为 底 )。 在 二 进 制 表示 法 中 ，IPv4 地 址 
展示 为 32 位 。 为 了 使 地 址 更 便于 阅读 ， 每 8 位 之 间 会 添加 一 到 两 个 空格 。 每 8 位 一 般 被 看 
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作 一 个 字 节 。 为 了 使 IPv4 地 址 更 易 读 ， 通 常 将 它 写成 十 进 制 的 形式 ， 不 同 字 节 利用 小 数 点 
分 开 。 这 个 格式 被 称 为 带 点 的 十 进 制 表示 法 。 注 意 ， 由 于 每 个 字 节 (8 位 ) 只 有 8 位， 因此 
在 带 点 的 十 进 制 表 示 法 中 每 个 数字 都 在 0 到 255 之 间 。 我 们 有 时 候 把 IPv4 地 址 用 十 六 进 制 
表示 。 每 个 十 六 进 制 数 字 与 二 进 制 表示 法 中 的 4 位 等 同 ， 这 意味 着 一 个 32 位 的 地 址 由 8 个 
十 六 进 制 数字 构成 。 这 种 十 六 进 制 表 示 方 法 通常 用 于 网 络 编程 。 图 6-27 展示 了 用 讨论 的 三 
种 方式 表示 同一 个 IP 地址 。 


二 进 制 | 10000001” ”~ 00000011 “00000111 -00011110 | 
带 点 的 十 进 制 表示 法 、 , 





十 六 进 制 | 8003071E 
图 6-27 地 址 表示 法 


在 任何 涉及 传递 的 通信 系统 网 络 中 ， 如 电话 网 络 或 邮政 网 络 ， 地 址 系统 都 是 分 级 的 。 在 
邮政 网 络 中 ， 地 址 (通信 地 址 ) 包括 国家 、 州 (或 省 )、 城 镇 、 街 道 、 门 牌号 和 邮件 收 件 人 姓 
名 。 同 样 ， 电 话 号 码 也 分 成 国家 代码 、 地 区 代码 、 本 地 交换 和 连接 。 

32 位 的 IPv4 地 址 也 是 分 级 的 ， 但 是 只 分 成 两 个 部 分 。 地 址 的 第 一 部 分 叫 作 前 级 ， 定 义 
网 络 ; 地 址 的 第 二 部 分 叫 作 后 缓 ， 定 义 节点 〈 设 备 
和 网 络 的 连接 )。 图 6-28 展示 了 一 个 32 位 IPv4 地 
址 的 前 级 和 后 级 。 前 级 的 长 度 是 nn 位 ,后缀 的 长 
度 就 是 32-n 位 。 前 级 和 后 缀 的 长 度 取决 于 网 络 





(组 织 ) 的 站 点 。 

IPv4 数据 报 

IP 使 用 的 数据 包 叫 作 数 据 报 。 图 6-29 展示 了 re he 
IPv4 数据 报 的 格式 。 数 据 报 是 一 种 长 度 不 一 的 数 图 6-28 ”IPv4 地 址 分 级 


据 包 ， 这 种 数据 包 包括 两 部 分 : 头 和 有 效 负荷 ( 数 
据 )。 头 的 长 度 是 20 一 60 字 节 ， 并 且 它 包含 路 由 和 传递 时 必要 的 信息 。 注 意 ， 一 个 字 节 是 8 位 。 


20-65 535 字 节 





图 6-29 ”IPv4 数据 报 


2. 第 6 版 网 际 协议 (IPv6 ) 
IPv4 的 一 些 地 址 耗 尽 之 类 的 缺点 促进 了 20 世纪 90 年 代 早 期 IP 协议 的 一 种 新 版 本 的 出 


现 。 新 版 本 叫 作 第 6 版 网 际 协议 (IPv6 ) 或 新 一 代 1P (IPng)， 是 一 个 在 扩大 IPv4 的 地 址 空 
间 的 同时 重新 设计 IP 数据 包 的 格式 并 修改 一 些 辅 助 性 协议 的 计划 。 有 趣 的 是 ，IPv5 是 一 个 
从 未 实现 过 的 计划 。 下 面 展 示 了 IPv6 协议 中 的 主要 改变 。 


IPv6 地 址 
为 了 防止 地 址 耗 尽 ，IPv6 使 用 128 位 来 定义 任何 连接 到 网 络 的 设备 。 地 址 显示 为 二 进 
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制 或 冒号 十 六 进 制 的 格式 。 第 一 个 格式 用 来 在 计算 机 中 存储 地 址 ， 第 二 个 格式 是 供 人 类 使 用 
的 。 图 6-30 展示 了 这 两 种 格式 。 


二 进 制 ( 128 位 ) 


111111101111011] won 0001001101000101 





FEF7:5623:0017;:A2B5:BC21:0243;7256:1345 
冒号 十 六 进 制 (32 个 数字 ) 
6-30 JPv6 地 址 表示 


如 图 6-31 所 示 , IPv6 中 的 地 址 事实 上 定义 了 三 个 等 级 : 站 点 (组织 )、 子 网 和 到 主机 的 连接 。 





连接 到 网 络 
图 6-31 IPv6 地 址 分 级 


IPv6 数据 报 
图 6-32 显示 了 IPv6 数据 报 的 格式 。 在 这 个 版 本 下 的 数据 报 也 是 包括 头 和 有 效 负荷 ( 数 


据 ) 两 部 分 的 长 度 可 变 的 数据 包 。 头 的 长 度 是 40 字 节 ， 然 而 ， 在 这 个 版 本 中 ， 一 些 扩展 头 
有 时 也 被 认为 是 有 效 负荷 的 一 部 分 。 


| 40 字 节 | 多 达 65 535 字 节 ] 





传输 方向 有 效 负荷 


图 6-32 IPv6 数据 报 


6.5 数据 链 路 层 
TCP/IP 协议 族 没有 定义 数据 链 路 层 中 的 任何 协议 。 这 一 层 是 网 络 中 连接 起 来 后 可 以 构 
成 因特网 的 区 域 。 这 些 网 络 ， 有 线 或 者 无 线 ， 都 接收 服务 并 将 服务 提供 给 网 络 层 。 这 正 可 以 


为 我 们 提供 当今 市 场 上 有 多 少 种 标准 协议 的 线索 。 
在 前 几 节 中 ， 我 们 学 到 了 在 网 络 层 的 通信 是 主机 间 的 。 然 而 ， 因 特 网 是 通过 连接 设备 
(路 由 吉 或 者 交换 机 ) 胶合 在 一 起 的 网 络 的 组 合体 。 如 果 一 个 数据 报 是 从 一 台 主 机 传输 到 另 


砂 划 规 网 络 而 因 和 状 网 117 


外 一 台 主 机 ， 它 需要 通过 这 些 网 络 传递 。 
图 6-33 使 用 了 和 前 面 三 节 相同 的 场景 ， 显 示 了 Alice 和 Bob 之 间 的 通信 。 然 而 ， 数 据 
链 路 层 的 通信 由 多 至 5 个 分 开 的 逻辑 连接 组 成 ， 这 些 逻 辑 连 接 在 路 径 中 的 数据 链 路 层 之 间 。 





Sky Research 公 司 应 用 层 
ed oo. 传输 层 
网 络 层 
数据 链 路 层 
物理 层 
R2 
和 网 络 层 
“me 数据 链 路 层 
到 其 他 ISP wo 人 oo 1 物理 层 
a R4 
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注意 : ER S34 
为 了 方便 ， 我 们 假设 从 源 到 Scientific 
目 的 只 有 一 条 可 用 路 径 。 物理 层 


图 6-33 ”数据 链 路 层 的 通信 


在 源 和 目的 处 只 包括 一 个 数据 链 路 层 ， 但 在 每 个 路 由 器 处 都 有 两 个 数据 链 路 层 。 造 成 这 
一 点 的 原因 是 Alice 的 和 Bob 的 计算 机 都 各 自 与 一 个 单独 的 网 络 相 连 ， 然 而 每 个 路 由 器 都 从 
一 个 网 络 中 得 到 输入 并 将 输出 发 送 至 另 一 个 网 络 。 


6.5.1 节点 和 链接 


虽然 应 用 层 、 传 输 层 和 网 络 层 的 通信 都 是 端 到 端的 ， 但 数据 链 路 层 的 通信 是 节点 对 节 
点 的 。 网 络 中 一 点 的 数据 单元 需要 穿 过 很 多 网 络 (LAN 和 WAN) 才能 到 达 另 外 一 点 。 这 
些 LAN 和 WAN 都 是 通过 路 由 器 连 在 一 起 的 。 传 统 上 会 将 两 个 端 主机 和 路 由 器 看 作 节 点 ， 
它们 之 间 的 网 络 看 作 链 接 。 图 6-34 是 当 数 据 单元 的 路 径 只 有 6 个 节点 时 链接 和 节点 的 
展示 。 





b) 节点 和 链接 
图 6-34 ”节点 和 链接 


连接 节点 的 链接 不 是 LAN 就 是 WAN。 


6.5.2 ”局域网 


在 本 章 的 开头 我 们 就 已 经 知道 了 局 域 网 (LAN) 是 为 有 限 的 地 理 区 域 (如 一 个 建筑 或 校 
园 ) 而 设计 的 计算 机 网 络 。 虽 然 局 域 网 可 以 用 作为 了 共享 资源 的 单一 目的 而 连接 组 织 内 各 计 
算 机 的 孤立 网 络 ， 但 现在 大 多 数 的 LAN 也 链接 到 广域网 (WAN) 或 因特网 上 。 

局 域 网 可 以 是 有 线 或 无 线 网 络 。 在 第 一 组 ，LAN 中 的 工作 站 之 间 通 过 有 线 连 接 ， 第 二 
组 中 的 工作 站 之 间 在 逻辑 上 通过 无 线 连 接 。 我 们 将 分 别 讨 论 这 两 组 。 

1. 有 线 LAN: 以 大 网  . 

虽然 在 过 去 就 已 经 发 明了 几 种 有 线 LAN， 但 只 有 一 种 幸存 了 下 来 一 一 以 太 网 。 可 能 这 
就 是 以 太 网 根据 因特网 社区 的 需要 升级 了 很 多 次 的 原因 。 : 

以 太 网 LAN 是 由 罗伯特 : 梅 特 卡 夫 和 大 卫 ' 博 格 斯 在 20 世纪 70 年 代 开 发 的 。 在 这 之 
后 ， 它 的 发 展 经 历 了 四 代 : 标准 以 太 网 ( 10 Mbps)、 快 速 以 太 网 ( 100 Mbps)、 千 兆 以 太 网 
(1 Gbps) 和 万 粮 以 太 网 ( 10 Gbps)。 数 据 速 率 ， 也 就 是 每 秒 传 输 的 位 数 ， 在 每 一 代 都 增加 


了 10 信 。 

标准 以 太 网 

我 们 把 最 初 数据 速率 为 10 Mbps (每 秒 1000 万 位 ) 的 以 太 网 技术 视 为 标准 以 太 网 。 在 
这 种 情况 下 ， 数 据 从 工作 站 传输 至 LAN 的 速度 被 定义 为 数据 速率 。 在 以 太 网 中 ， 速 度 是 每 
秒 1000 万 位 。 然 而 ,这些 位 不 是 一 个 接着 一 个 发 送 的 ， 每 组 数据 都 被 打包 起 来 ， 并 称 为 帧 。 
帧 中 不 仅 包括 从 发 送 者 到 目标 的 数据 ， 还 带 有 一 些 诸如 源 地 址 ( 48 位 )、 目 的 地 址 (48 位 )、 
数据 类 型 、 实 际 数据 的 信息 和 其 他 一 些 作为 守卫 来 帮助 检查 传输 中 数据 完整 性 的 控制 位 。 如 
果 我 们 把 一 帧 看 作 一 个 装着 发 信人 寄 给 收 信 人 的 信 的 信封 ,数据 在 信封 内 ， 而 其 他 诸如 地 址 
之 类 的 信息 都 在 信封 上 。 在 LAN 中 ， 数 据 包 都 封装 在 数据 帧 中 。 图 6-35 展示 了 一 个 以 太 网 
LAN 和 帧 格式 。 

快速 以 太 网 

20 世纪 90 年 代 ， 以 太 网 通过 把 传输 速率 提升 至 100 Mbps 跨越 了 一 大 步 ， 这 个 新 一 代 
的 以 太 网 被 称 为 快速 以 太 网 。 快 速 以 太 网 的 设计 者 需要 使 其 能 够 与 标准 以 太 网 竞争 ， 所 以 大 
部 分 的 协议 如 地 址 、 帧 格式 都 没有 变 。 由 于 传输 速率 的 提高 ， 标 准 以 太 网 的 一 些 基 于 传输 速 
率 的 特征 需要 重新 修订 。 
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最 小 负荷 长 度 : 46 字 节 
。 机 大 生病 长度 1500 字 当 









Ed 
6 字 节 ”2 字 节 


最 小 帧 长 诬 ，512 位 或 64 字 节 
: 12 144 位 或 1518 


图 6-35 ”以太 网 帧 








干 兆 以 太 网 

对 更 高 的 数据 速率 的 需求 促使 了 王 兆 以 太 网 协议 (1000 Mbps) 的 设计 。 万 兆 以 太 网 的 
目标 是 将 数据 速率 升级 至 1 Gbps,， 但 是 保持 地 址 长 度 、 帧 格式 以 及 最 大 和 最 小 数据 帧 长 度 
不 变 。 

万 兆 以 太 网 

近年 来 ， 以 太 网 又 开始 被 考虑 放 在 城市 范围 内 使 用 。 这 个 想法 是 扩展 以 太 网 的 技术 ， 提 
高 数据 速率 ， 并 扩大 覆盖 距离 ， 这 样 以 太 网 就 可 以 用 作 LAN 和 MAN ( 城 域 网 )。 设 计 万 兆 
以 太 网 的 目标 可 以 总 结 为 升级 数据 速率 至 10 Gbps， 保 持 数 据 帧 大 小 和 格式 不 变 ， 同 时 允许 
LAN、MAN 和 WAN 可 能 的 互联 。 这 个 数据 速率 只 有 此 时 的 光纤 技术 可 以 达到 。 

2. 无 线 LAN 

无 线 通 信和 是 发 展 最 快 的 技术 之 一 。 世 界 各 地 对 无 线 连 接 设备 的 需求 都 在 不 断 增长 。 无 线 
LAN 可 在 大 学 校园 、 办 公 楼 和 其 他 很 多 公共 区 域 找 到 。 在 有 线 LAN 和 无 线 LAN 之 间 我 们 
可 以 看 见 的 第 一 个 不 同 之 处 就 是 传输 媒介 。 在 有 线 LAN 中 ， 使 用 电缆 来 连接 主机 。 在 无 线 
LAN 中 ， 传 输 媒 介 是 空气 ， 信 和 号 通常 是 在 空气 中 传播 的 。 当 无 线 LAN 中 的 主机 互相 通信 
时 ， 它 们 在 共享 同样 的 媒介 (多 个 访问 )。 在 这 个 领域 现在 有 两 种 技术 : 无 线 以 太 网 和 蓝牙 。 

无 线 以 太 网 (WiFi) 

电气 和 电子 工程 师 协 会 (IEEE) 为 无 线 LAN 定义 规格 ,无线 LAN 有 时 也 被 称 为 无 线 以 
太 网 或 者 WiFi ( wireless fidelity 的 缩写 )。 然 而 ，WiFi 其 实 是 一 个 由 WiFi 联盟 (一 个 拥有 
超过 300 个 成 员 公 司 的 国际 非 营利 行业 协会 ) 认证 的 无 线 LAN。 这 个 标准 定义 了 两 种 服务 
基本 服务 集 (BSS) 和 扩展 服务 集 (ESS)。 第 二 种 服务 使 用 额外 设备 ( 接 人 点 或 AP) 作为 连 
接 其 他 LAN 或 WAN 的 交换 机 。 图 6-36 显示 了 这 两 种 服务 。 





基本 服务 集 (BSS ) 扩展 服务 集 ( ESS ) 
6-36 BSS 和 ESS 


蓝牙 
蓝牙 是 一 种 无 线 LAN 技术 ， 它 用 于 连接 不 同 功能 的 设备 ， 如 电话 、 笔 记 本 电脑 、 计 算 
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机 (台式 机 以 及 笔记 本 电脑 )、 照 相机 、 打 印 机 ， 甚 至 是 咖啡 机 之 类 的 设备 ， 只 要 这 些 设 备 
之 间 的 距离 比较 短 。 蓝 牙 LAN 是 一 个 临时 网 络 ， 这 也 就 意味 着 这 个 网 络 是 自发 的 ， 这 些 有 
时 候 称 为 小 配件 的 设备 互相 连接 之 后 可 以 形成 一 个 叫 作 蓝牙 微 网 的 网 络 。 如 果 其 中 一 个 小 设 
备 有 连 入 因特网 的 功能 ， 则 蓝牙 LAN 就 可 以 连 人 因特网 。 蓝 牙 LAN 由 于 本 身 特性 规模 较 
小 。 如 果 有 很 多 小 配件 想 要 连 人 蓝牙 LAN 中 ， 通 常会 引起 混乱 。 

蓝牙 技术 有 很 多 应 用 。 无 线 鼠 标 和 无 线 键盘 之 类 的 外 围 设 备 可 以 通过 这 个 技术 与 计算 机 
通信 。 在 一 个 小 的 保健 中 心里 ， 监 控 设 备 可 以 通过 这 种 方法 和 感应 设备 通信 。 家 庭 安 全 装置 
可 以 利用 这 个 技术 来 将 不 同 的 传感器 连接 到 主要 的 安全 控制 器 上 。 与 会 者 可 以 在 参与 会 议 时 
同步 他 们 的 笔记 本 电脑 。 

蓝牙 技术 最 初 是 爱立信 公司 开启 的 一 个 项 目 ， 它 的 命名 来 自 统一 了 丹麦 和 挪威 的 丹麦 
王 Harald Blaatand ( 940 一 981 )， 这 里 的 Blaatand 英 译 为 Bluetooth， 也 就 是 蓝牙 。 


6.5.3 ”广域网 

如 前 所 述 ， 因 特 网 中 连接 两 个 节点 的 可 能 是 LAN 也 可 能 是 WAN。 与 LAN 情况 一 样 ， 
WAN 也 可 以 分 成 有 线 和 无 线 两 类 。 下 面 将 简要 地 分 别 讨论 。 

1. 有线 WAN 

当今 的 以 太 网 中 有 多 种 有 线 WAN， 有 些 是 点 对 点 的 ， 有 些 是 交换 式 的 。 

点 对 点 无 线 WAN 

现在 我 们 可 以 用 几 种 点 对 点 无 线 网 来 为 连接 到 网 络 的 居民 和 企业 提供 所 谓 的 网 络 未 端 
服务 。 


拨号 上 网 服务 
拨号 网 络 或 连接 使 用 电话 网 络 提供 的 服务 来 传输 数据 。 电 话 网 络 起 源 于 19 世纪 末 ， 整 


个 网 络 最 初 是 一 个 声音 传输 系统 。 随 着 计算 机 时 代 的 到 来 ， 这 个 网 络 在 20 世纪 80 年 代 开 始 
在 传输 声音 的 同时 传输 数据 。 在 20 世纪 最 后 的 十 年 里 ， 电 话 网 络 经 历 了 很 多 技术 上 的 改变 。 


对 于 数字 化 数据 通信 的 需求 导致 了 拨号 调制 解 调 器 的 发 明 。 
调制 解 调 器 这 个 词 是 一 个 组 合 词 ， 它 指 构成 这 个 设备 的 两 个 功能 性 实体 : 信号 调制 器 和 


信号 解 调 器 。 调 制 器 通过 数据 制造 信号 ， 解 调 器 从 调制 信号 中 恢复 数据 。 图 6-37 显示 了 调 
制 解 调 器 的 思想 。 


数字 信号 模拟 信号 高 速 数字 信和 号 





DE A 


调制 解 调 器 。 本 地 回环 





上 载 : 33.6 Kbps 下 载 :56 Kbps 
一 -一 一 一 一 一 一 他 < 一 一 一 一 一 


图 6-37 ”提供 因特网 连接 的 拨号 网 络 


数字 用 户 线 路 (DSL ) 

在 传统 调制 解 调 器 达到 其 最 高 数据 速率 之 后 ， 电 话 公司 开发 出 了 另 一 种 技术 一 一 DSL， 
来 提供 高 速 网 络 连接 。 数 据 用 户 线路 ( DSL) 技术 是 现 有 的 电话 上 支持 高 速 通 信 中 最 有 前 
途 的 一 种 。DSL 技术 是 一 系列 通过 不 同 的 首 字 母 区 分 的 技术 (ADSL、VDSL、HDSL 和 
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SDSL)。 这 个 系列 通常 用 xDSL 表示 ， 这 里 的 x 代表 A、V、H 或 $。 我 们 只 讨论 ADSL。 
这 个 系列 中 的 第 一 个 技术 是 非 对 称 数字 用 户 线 路 (ASDL)。ASDL 在 下 游 方 向 (从 网 络 到 居 
民 ) 比 在 上 游 方 向 (从 居民 到 网 络 ) 提供 更 快 的 速度 (比特 率 )。 这 也 是 为 什么 它 被 称 为 非 对 
称 的 ( 见 图 6-38 ) 。 





6-38 ASDL 点 对 点 网 络 


ADSL 人 允许 用 户 同时 使 用 语音 信道 和 数据 信道 。 上 游 速率 可 以 达到 1.44 Mbps。 然 而 ， 由 于 
该 信道 中 的 高 级 别 的 噪声 ， 数 据 速率 通常 低 于 500 Kbps。 下 游 的 数据 速率 可 以 达到 13.4 Mbps。 
然而 ， 由 于 该 信道 中 的 噪声 ， 数 据 速率 通常 低 于 8 Mbps。 很 有 意思 的 一 点 是 ， 这 种 情况 下 
电话 公司 充当 ISP， 所 以 电子 邮件 或 网 络 连接 之 类 的 服务 都 由 电话 公司 自身 提供 。 

有 线 电 视 网 络 

有 线 电视 网 络 最 初 是 为 了 那些 由 于 山脉 等 自然 障碍 造成 无 法 接收 数据 的 用 户 提供 电视 
节目 而 创造 的 。 后 来 有 线 电视 网 络 在 那些 仅仅 希望 得 到 更 好 的 信号 的 人 中 受到 欢迎 。 除 此 之 
外 ， 有 线 电视 网 络 使 通过 微波 连接 来 使 用 远程 广播 电台 成 为 可 能 。 有 线 电视 也 通过 使 用 一 些 
最 初 为 视频 而 设计 的 信道 在 网 络 接 人 中 寻找 到 很 好 的 市 场 。 

电缆 公司 现在 正在 和 电话 公司 竞争 ， 想 要 得 到 高 速 数据 传输 的 住宅 用 户 。DSL 技术 越 
过 本 地 回环 为 住宅 用 户 提供 高 数据 速率 的 连接 。 然 而 ，DSL 使 用 的 现成 的 非 屏 蔽 式 双 绞 线 电 
缆 很 容易 受到 干扰 。 这 使 数据 速率 受到 了 上 限 的 限制 。 一 种 解决 策略 就 是 使 用 有 线 电 视 网 
络 。 本 节 简 单 讨 论 这 个 技术 。 图 6-39 展示 了 该 服务 的 一 个 例子 。 








图 6-39 有 线 服务 


交换 式 有 线 WAN 
很 明显 ， 当 今 的 网 络 不 能 只 通过 提供 网 络 末端 连接 的 点 对 点 有 线 WAN 进行 操作 。 我 们 


需要 交换 式 有 线 WAN 来 连接 网 络 的 骨干 网 。 过 去 为 了 这 个 目的 设计 了 SONET、ATM 等 协 
议 。 然 而 ， 网 络 过 于 复杂 ， 所 以 有 关 它 们 的 讨论 超出 了 本 书 的 范围 。 

2. 无 线 WAN 

如 今 网 络 的 范围 如 此 之 大 ， 以 至 于 有 时 候 仅 通过 有 线 WAN 无 法 向 世界 的 每 一 个 角落 提 
供 服 务 。 我 们 必定 需要 无 线 WAN。 下 面 描述 了 出 于 这 个 目的 而 使 用 的 几 种 技术 。 
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WiMax 
全 球 互 联接 入 (WiMax) 是 DSL 或 通过 电缆 连接 因特网 的 无 线 版 ， 它 提供 两 种 服务 ( 固 


定 WiMax) 将 主要 工作 站 与 固定 工作 站 或 移动 电话 之 类 的 移动 工作 站 相连 接 。 图 6-40 展示 
了 这 两 种 连接 。 





BS; 基站 
FSub; 固定 用 户 工作 站 






图 6-40 WiMax 


手机 网 络 
现今 的 另 一 种 无 线 WAN 是 最 初 为 语音 通信 而 设计 的 移动 电话 (也 称 蜂窝 电话 )， 现 在 它 


也 可 以 用 于 网 络 通信 。 如 我 们 所 知 的 那样 ， 蜂 窝 式 网 络 将 地 球 划分 成 单元 。 移 动工 作 站 与 它 
们 该 时 刻 所 在 的 单元 内 的 固定 天 线 通信 。 当 用 户 移动 到 另 一 个 单元 时 ， 通 信和 存在 于 移动 设备 
和 新 的 天 线 之 间 。 


卫星 网 络 
卫星 网 络 是 由 节点 组 合 而 成 的 ， 这 些 节点 一 部 分 是 卫星 ， 它 们 提供 地 球 上 一 点 到 男 一 点 


的 通信 。 网 络 中 的 一 个 节点 可 以 是 一 个 卫星 、 一 个 地 球 工作 站 或 者 一 个 最 终 用 户 终端 或 电话 。 

卫星 网 络 很 像 蜂窝 式 网 络 ， 因 为 它 将 整个 星球 划分 成 了 单元 。 卫 星 可 以 提供 往返 于 地 球 
上 无 论 多 远 的 任意 地 点 处 的 传输 功能 。 这 个 优势 使 得 高 品质 的 通信 可 以 提供 给 世界 上 的 落后 
地 区 ， 却 不 需要 在 地 面 基 础 设施 上 进行 巨大 投资 。 


6.6 ”物理 层 

如 果 不 讨论 物理 层 ， 关 于 TCP/IP 协议 族 的 讨论 就 是 不 完整 的 。 物 理 层 的 角色 是 将 从 数 
据 链 路 层 接 收 的 比特 (位 ) 转换 成 用 于 传输 的 电磁 信号 。 当 比特 被 转换 成 信号 后 ， 信 和 号 将 被 
传送 至 传输 媒介 ， 这 就 是 下 一 节 要 讨论 的 主题 。 图 6-41 使 用 了 和 前 面 四 节 相 同 的 场景 ， 但 


是 现在 的 通信 是 在 物理 层 。 


6.6.1 数据 和 信号 

在 物理 层 的 通信 是 节点 对 节点 的 ， 但 是 节点 交换 的 是 电磁 信和 号 。 

物理 层 的 一 个 主要 功能 就 是 为 比特 确定 在 节点 间 传 输 的 路 线 。 但 是 就 像 它 代表 的 是 节点 
(主机 、 路 由 器 或 交换 机 ) 内 存 中 存储 的 两 个 可 能 的 值 一 样 ， 比 特 不 能 直接 发 送 到 传输 媒介 
《有 线 或 无 线 ) ; 这 些 比特 在 传输 之 前 需要 先 转换 成 信号 。 所 以 物理 层 的 主要 责任 是 高 效 地 将 
这 些 比特 转换 成 电磁 信和 号。 我们 首先 需要 理解 数据 的 本 质 和 信号 的 种 类 ， 才 能 明白 我 们 如 何 
有 效 地 进行 这 种 转换 。 


模拟 数据 和 数字 数据 
数据 可 以 有 两 种 形式 一 一 模拟 的 和 数字 的 。 模 拟 数据 这 个 词 指 连 续 的 信息 。 模 拟 数据 ， 


比如 人 发 出 的 声音 ， 呈现 的 是 连续 的 值 。 当 一 个 人 说 话 时 ， 空 气 中 就 出 现 了 一 个 模拟 波 。 这 
个 模拟 波 可 以 通过 麦克 风 捕 捉 并 转换 成 模拟 信号 或 者 采样 并 转换 成 数字 信和 号 。 
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Alicc 
应 用 层 
Sky Research 公 司 传输 层 
到 “lp timp> 网 络 层 
.| ty A ee 2A 
过关 





到 其 他 ISP wl 







sr 时 才 物理 导 
R5 
[网络 层 
夯 
物理 层 
R7 
my [二 J 网 络 层 
门口 数据 链 路 层 
oo 物理 层 
广域网 交换 机 oi 
ES》 路 由 器 应 用 层 
有 传输 层 
注意 ; CANIS 30D ES 网 络 层 
为 了 方便 ， 我 们 假设 从 源 到 Scientific Books 在 线 书 商 [数据 链 路 层 
目的 只 有 一 条 可 用 路 径 。 物理 层 


图 6-41 物理 层 的 通信 


数字 数据 呈现 的 是 离散 的 值 。 例 如 ， 数 据 在 计算 机 内 存 中 是 以 0 和 1 的 形式 存储 的 。 它 
们 可 以 转换 成 数字 信号 或 者 调制 成 通过 媒介 进行 传输 的 模拟 信号 。 

就 像 它 们 所 代表 的 数据 一 样 ， 信 号 也 可 以 是 模拟 的 或 数字 的 。 模 拟 信号 在 一 个 时 间 段 中 
有 无 限 种 不 同 的 等 级 强度 ， 就 像 当 波 从 A 值 移动 到 B 值 的 时 候 ， 它 的 路 径 经 过 并 包括 无 限 个 
值 。 与 之 不 同 的 是 ， 数 字 信 号 可 以 只 拥有 有 限 个 定义 的 值 。 虽 然 每 个 值 可 以 是 任意 数字 ,但 
通常 它们 都 像 1 和 0 这 么 简单 。 展 示 信 号 最 简单 的 方法 是 将 它们 绘制 在 一 组 相互 垂直 的 轴 上 。 
纵 轴 代表 信号 的 值 或 强度 ， 横 轴 代 表 时 间 。 图 6-42 绘制 了 一 个 模拟 信号 和 一 个 数字 信号 。 


值 值 


时 间 时 间 


a) 模拟 信和 号 b) 数字 信和 号 
图 6-42 ”模拟 信号 和 数字 信号 的 对 比 
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6.6.2 ”数字 化 传输 

计算 机 网 络 是 为 将 信息 从 一 点 发 送 到 另 一 点 而 设计 的 。 这 个 信息 需要 转换 成 数字 信和 号 或 
模拟 信和 号 来 进行 传输 。 如 果 这 个 数据 是 数据 化 的 ， 需 要 用 数 数 转换 技术 ， 即 一 种 将 数字 数据 
转换 成 数字 信号 的 方法 。 如 果 数 据 是 模拟 的 ， 需 要 使 用 模 数 转换 技术 ， 即 一 种 将 模拟 数据 转 
换 成 数字 信号 的 方法 。 


1. 数 数 转换 
如 果 数 据 是 数字 化 的 并 且 需 要 传输 数字 信和 号， 可 以 使 用 数字 到 数字 的 转换 ， 将 数字 数据 


转换 成 数字 信号。 虽然 有 很 多 技术 可 以 达到 这 个 目的 ， 但 当 数 据 处 于 最 简单 的 一 位 或 一 组 位 
的 形式 时 ， 这 个 数据 如 图 6-43 所 示 用 一 个 信和 号 电 平 表示 。 


数字 数据 数字 信号 数字 数据 





图 6-43 ” 数 数 转换 
2. 模 数 转换 
有 时 候 我 们 通过 麦克 风 或 照相 机 得 到 一 个 模拟 信号 ， 现 在 的 趋 问 是 将 模拟 信和 号 转换 成 数 


字数 据 ， 因 为 数字 信号 受到 噪声 干扰 的 影响 更 小 。 虽 然 有 很 多 技术 可 以 达到 这 个 目的 ， 但 最 
简单 的 方法 是 对 模拟 信和 号 采样 来 生成 一 个 数字 化 数据 ， 再 像 前 面 讨论 过 的 一 样 将 数字 数据 转 


换 成 数字 信号 ， 如 图 6-44 所 示 。 


模拟 信和 号 模拟 信号 






图 6-44 ” 模 数 转换 


6.6.3 ”模拟 传输 

虽然 数字 化 传输 是 令 人 满意 的 ， 但 它 需 要 一 个 专用 通道 。 模 拟 传输 是 没有 专用 通道 时 的 
唯一 选择 。 例 如 ， 当 我 们 在 空气 中 进行 传播 时 ， 空 气 属于 所 有 人 ， 而 我 们 只 能 使 用 信道 中 可 
用 的 那 一 部 分 。 基 于 可 用 的 数据 类 型 ， 我 们 可 以 用 数 模 转 换 或 模 模 转 换 。 


1. 数 模 转 换 
数 模 转换 是 基于 数字 数据 的 信息 改变 模拟 信号 的 某 个 特征 的 过 程 。 图 6-45 展示 了 数字 


信息 、 数 模 转 换 过 程 和 最 终 得 到 的 模拟 信号 。 
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数字 数据 模拟 信号 数字 数据 
OEOT “eT0 | \ 
发 送 广 接收 广 


图 6-45 ” 数 模 转换 


2. 模 模 转换 
模 模 转换 是 基于 模拟 数据 的 信息 改变 模拟 信号 的 某 个 特征 的 过 程 。 图 6-46 展示 了 模拟 


信息 、 模 模 转 换 过 程 和 最 终 得 到 的 模拟 信号 。 


] 模拟 信号 


二 0 所 要 方 
图 6-46 ” 模 模 转换 


模拟 信和 号 


模拟 信和 号 





6.7 ”传输 介质 

在 物理 层 产 生 的 电子 信号 需要 传输 介质 来 从 一 端 传输 到 另 一 端 。 传 输 介质 通常 在 物理 层 
之 下 ,并且 受到 物理 层 的 直接 控制 。 我 们 可 以 说 传输 介质 属于 第 0 层 。 图 6-47 展示 了 传输 
介质 相对 于 物理 层 的 位 置 。 | 


mm] [mm 
传输 介质 | 


电缆 或 空气 
图 6-47 传输 介质 和 物理 层 


] 
传输 介质 可 以 大 致 定义 为 任何 将 信息 从 源 传输 到 目标 的 介质 。 例 如 ， 两 个 一 边 用 餐 一 边 


交谈 的 人 的 传输 介质 就 是 空气 。 空 气 可 以 把 信息 转换 成 烟雾 信号 或 信号 量 。 对 于 书信 来 说 ， 
传输 介质 可 能 就 是 邮 车 、 卡 车 ， 甚 至 飞机 。 

在 电信 中 ， 传 输 介质 可 以 分 为 两 大 类 : 导向 介质 和 无 导向 介质 。 导 向 介质 包括 双 绞 线 、 
同 轴 电 缆 和 光纤 电缆 。 无 导向 介质 是 自由 空间 。 


6.7.1 导向 介质 
导向 介质 就 是 那些 用 来 提供 从 一 个 设备 到 另 一 个 设备 的 通道 的 ， 包 括 双 绞 线 、 同 轴 电 缆 
和 光纤 电缆 。 图 6-48 展示 了 三 种 导向 介质 。 


1. 双 绞 线 
双 绞 线 包括 两 根 绞 在 一 起 的 导线 (通常 是 铜 线 ) 这 两 根 导线 是 分 别 包 着 塑料 绝缘 的 。 
双 绞 线 中 一 根 的 作用 是 将 信号 传送 到 接收 方 ， 另 一 根 的 作用 仅仅 是 接地 参考 。 接 收 方 使 用 两 


者 的 不 同 。 








c) 光纤 电缆 
图 6-48 导向 介质 


除了 来 自发 送 方 的 信号 以 外 ， 干 涉 (噪声 ) 也 会 影响 两 根 线 并 制造 出 多 余 信 和 号。 如果 两 
根 线 是 平行 的 ， 那 么 这 些 多 余 信 和 号 在 两 根 线 上 的 影响 是 不 一 样 的， 因为 它们 相对 于 噪声 源 处 
于 不 同 的 位 置 。 通 过 将 两 根 线 绞 在 一 起 ， 平 衡 就 得 到 了 保持 。 

电话 公司 用 于 提供 高 数据 率 链接 的 DSL 线路 也 是 双 绞 线 。 

2. 同 轴 电 绕 

同 轴 电 缆 有 一 个 位 于 中 心 且 密 封 在 绝缘 外 壳 中 的 实心 (通常 是 铜 导 线 ) 或 绞 合 线 作 为 核 
心 导 线 ， 同 时 这 个 导线 也 依次 密封 在 金属 稍 、 金 属 网 或 二 者 构成 的 外 金属 包装 和 绝缘 护 套 
中 ， 而 不 是 使 用 两 根 线 。 这 里 的 外 层 金属 包装 既 用 作 抗 噪声 的 屏蔽 ， 也 作为 补 全 电路 的 第 二 
导体 使 用 。 整 个 电缆 由 塑料 护 套 保护 。 

有 线 电视 网 络 使 用 的 是 同 轴 电 缆 。 传 统 的 有 线 电 视 网 络 中 ， 整 个 网 络 由 同 轴 电缆 构成 。 
然而 ， 后 来 有 线 电视 供应 商 把 大 多 数 的 媒介 换 成 了 光纤 电缆 ， 混 合 网 络 也 只 在 网 络 的 边缘 靠 
近 顾 客房 屋 处 使 用 同 轴 电缆 。 


3. 光纤 电缆 
光纤 电缆 由 玻璃 或 塑料 构成 ， 它 以 光 的 形式 传递 信和 号。 这 种 技术 使 用 一 束 光 在 进入 密度 


较 低 介质 时 既 不 反射 也 不 折射 的 特性 。 在 到 璃 或 塑料 介质 外 覆盖 另 一 一 种 密度 较 小 的 介质 ( 称 


为 包 层 ) 来 导 引 光 通 过 媒介 。 
光纤 电缆 通常 在 骨干 网 中 找到 ， 因 为 它 的 高 带宽 具有 成 本 效益 。 


6.7.2 非 导 向 介质 : 无 线 


非 导向 介质 不 通过 物理 上 的 导体 来 传播 电磁 波 。 这 种 通信 通常 归 为 无 线 通 信 。 信 和 号 通常 
在 自由 空间 中 传播 ， 这 样 任何 有 能 够 接收 信和 号 的 设备 的 人 都 可 以 使 用 它 。 
图 6-49 展示 了 电磁 波谱 中 用 于 无 线 通 信和 的 波段 ， 从 3 kHz 到 900 THz。 
可 见 光 





3 300 400 900 
kHz GHz THz THz 


图 6-49 ”用 于 无 线 通信 的 电磁 波 频谱 


矿区 入网 络 和 因 矢 网 127 





现在 用 三 种 不 同 范围 的 电磁 波 频谱 来 进行 通信 : 无 线 电波 、 微 波 和 红外 波 。 

1. 无 线 电波 

频率 在 3 kHz 一 1 GHz 之 间 的 电磁 波 通常 叫 作 无 线 电波 。 它 们 通常 用 于 无 线 电 通信 。 

2. 微波 

频率 在 1 一 300 GHz 的 电磁 波 叫 作 微波 。 微 波 是 没有 方向 性 的 。 当 天 线 传输 微波 时 ， 它 
们 可 以 集中 得 很 窗 ， 也 就 是 说 发 送 和 接收 徽 波 的 天 线 需要 对 齐 。 微 波 没有 方向 性 的 一 个 最 明 
显 的 优势 就 是 一 对 天 线 可 以 在 不 和 另 一 对 天 线 相互 干扰 的 情况 下 对 齐 。 

3. 红外 波 

红外 波 频 率 在 300 GHz 一 400 THz 之 间 (波长 在 770 nm 一 1 mm 之 间 )， 它 可 以 用 于 短 
程 通 信 。 红 外 波 的 频率 较 高 ， 无 法 穿 透 墙壁 ， 这 个 有 着 明显 优势 的 特点 防止 了 不 同系 统 之 间 
的 干扰 ， 一 个 房间 内 的 短程 通信 系统 不 会 受到 下 一 个 房间 内 的 另 一 个 系统 的 影响 。 当 使 用 红 
外 遥控 器 时 ， 不 会 受到 邻居 使 用 遥控 器 的 和 干扰。 但 是 同样 的 特征 使 红外 信和 号 对 于 长 距离 通信 
而 言 是 无 用 的 。 另 外 ， 我 们 不 能 在 室外 使 用 红外 波 ， 因 为 太阳 光 中 的 红外 波 会 对 通信 产生 


干扰 。 
6.8 ” 章 末 材料 
推荐 读物 

有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


。 Forouzan, B. and Mosharrf F. Computer Networks: 4 Top-Down Approach, New York: 


McGraw-Hill Education, 2012 
| 
® Forouzan, B. Data Communication and Networking, New York: McGraw-Hill Education, 


2013 
® Forouzan, B. TCP/IP Protocol Suite, New York: McGraw-Hill Education, 2010 
。 Forouzan, B. Local Area Networks, New York: McGraw-Hill Education, 2003 
® Kurose, J. and Ross, K. Computer Networking, Reading, MA: Addison-Wesley, 2007 


关键 术语 

10-Gigabit Ethernet (万 兆 以 太 网 ) connecting device (连接 设备 ) 
analog-to-analog conversion ( 模 模 转换 ) connectionless protocol (无 连接 协议 ) 
analog-to-digital conversion ( 模 数 转换 ) country domain (城市 域 ) 

analog data (模拟 数据 ) demodulator ( 解 调 器 ) 

analog signal (模拟 信和 号) digital-to-analog conversion( 数 模 转换 ) 
application layer (应 用 层 ) digital-to-digital conversion ( 数 数 转换 ) 
bit rate〔〈 比 特 率 ) digital data (数字 数据 ) 

Bluetooth (蓝牙 ) digital signal (数字 信号) 

cellular telephony (移动 电话 ) digital subscriber line (DSL， 数 字 用 户 线路 ) 
ciphertext ( 密 文 ) domain name (域名 ) 


client-server paradigm (客户 机 - 服务 器 范式 ) ”Domain name server (DNS， 域 名 服务 器 ) 
coaxial cable ( 同 轴 电 费 ) domain name space (域名 空间 ) 
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dotted-decimal notation ( 带 点 的 十 进 制 表 示 法 ) 

electronic mail (email ， 电 子 邮 件 ) 

end system ( 端 系统 ) 

ephemeral port number (临时 端口 号 ) 

Fast Ethernet (快速 以 太 网 ) 

fiber-optic cable (光纤 电缆 ) 

File Transfer Protocol (FTP， 文 件 传输 协议 ) 

frame( 帧 ) 

generic domain (一 般 域 ) 

Gigabit Ethernet( 千 兆 以 太 网 ) 

guided media (导向 介质 ) 

hardware (硬件 ) 

header ( 头 ) 

host (主机 ) 

host identifier (主机 标识 符 ) 

hypertext ( 超 文本 ) 

HyperText Markup Language (HTML， 超 文 
本 标记 语言 ) 

HyperText Transfer Protocol (HTTP， 超 文本 
传输 协议 ) 

infrared waves (红外 波 ) 

internet (网 际 网 ) 

Internet (因特网 ) 

Internet address (因特网 地 址 ) 

Internet Protocol (网 际 协议 ) 

Internet Protocol version 6 (IPv6， 第 6 版 网 
际 协议 ) 

internet service provider (ISP， 因 特 网 服务 
供应 商 ) 

Internetwork (互联 网 络 ) 

IP address (IP 地 址 ) 

IP datagram (IP 数据 报 ) 

IP new generation (IPng， 新 一 代 IP) 

link (链接 ) 

local area network (LAN， 局 域 网 ) 

Message Access Agent (MAA， 消 息 访问 代理 ) 

message transfer agent (MTA ， 消 息 传送 代理 ) 

metropolitan area network (MAN， 城 域 网 ) 

modem (调制 解 调 器 ) 

modularity (模块 化 ) 


modulator (调制 器 ) 

module (模块 ) 

name space (命名 空间 ) 

network layer (网 络 层 ) 

node (节点 ) 

packetizing (封装 ) 

peer-to-peer(P2P) paradigm (对 等 模式 ) 
physical layer (物理 层 ) 


”port number (端口 号 ) 


protocol (协议 ) 

protocol layering (协议 层 ) 

remote login (远程 登录 ) 

router (路 由 器 ) 

Secure Shell (SHH， 安 全 外 过) 

segment ( 段 ) 

software (软件 ) 

source to destination delivery ( 源 至 目的 传递 ) 

Standard Ethernet (标准 以 太 网 ) 

switch (交换 机 ) 

switched WAN (交换 式 广域网 ) 

TCP/IP protocol suite (TCP/IP 协议 族 ) 

TELNET (terminal network， 终 端 网 络 ) 

Transmission Control Protocol (TCP ， 传 输 控 
制 协议 ) 

transmission medium (传输 介质 ) 

transmission rate (传输 率 ) 

twisted-pair cable( 双 绞 线 电缆 ) 

unguided media (无 导向 介质 ) 

uniform resource locator ( URL， 统 一 资源 定 
位 符 ) 

user agent (UA ， 用 户 代理 ) 

user datagram (用 户 数 据 报 ) 

User Datagram Protocol (UDP， 用 户 数 据 报 
协议 ) 

web page (网 页 ) 

well-known port number (知名 端口 号 ) 

wide area network (WAN， 广 域 网 ) 

Worldwide Interoperability Access ( WiMAX ， 
全 球 互联 接 人 ) 

World Wide Web (WWW， 万 维 网 ) 


小 结 
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。 网 络 是 通过 通信 和 链接 连接 的 一 组 设备 。 现 今 ， 当 提起 网 络 时 ， 我 们 通常 指 的 是 两 种 基 


6.9 


本 类 型 的 网 络 : LAN 和 WAN。 当 今 网 络 由 通过 连接 设备 和 交换 站 连接 的 很 多 局 域 网 
和 广域网 构成 。 协 议 是 一 组 控制 通信 的 规则 。TCP/IP 是 一 个 由 5 层 构成 的 分 级 协议 
族 。 这 5 层 分 别 为 应 用 层 、 传 输 层 、 网 络 层 、 数 据 链 路 层 和 物理 层 。 

网 络 中 的 应 用 使 用 客户 机 - 服务 器 模式 或 端 到 端 模 式 。 万 维 网 (WWW) 是 一 个 由 世 
界 各 地 的 链接 构成 的 存储 库 。 用 来 得 到 万 维 网 上 的 数据 的 主要 协议 是 超 文 本 传输 协议 
(HTTP)。 文 件 传输 协议 (FTP) 是 TCP/IP 客户 机 - 服务 器 应 用 ， 它 的 作用 是 从 一 台 
计算 机 复制 文件 到 另 一 台 计 算 机 。 电 子 邮 件 是 流行 的 因特网 应 用 之 一 。TELNET 是 允 
许 用 户 访问 远程 计算 机 的 客户 机 - 服务 器 应 用 程序 ， 使 用 户 能 访问 远程 系统 。 域 名 
系统 (DNS) 是 在 网 络 上 使 用 唯一 名 称 标 识 每 一 台 主 机 的 客户 机 - 服务 器 应 用 程序 。 
传输 层 协 议 的 主要 责任 是 提供 进程 到 进程 的 通信 。UDP 是 提供 不 可 靠 、 无 连接 服务 
的 传输 协议 。 传 输 控 制 协议 (TCP) 是 另 一 个 提供 面向 连接 的 可 靠 服 务 的 传输 层 协议 。 
网 络 层 负责 监督 底层 物理 网 络 对 数据 包 的 处 理 。IPv4 是 负责 源 至 目标 传递 的 一 个 不 
可 靠 的 无 连接 协议 。 在 TCP/IP 协议 族 的 IP 层 使 用 的 标识 符 叫 作 IP 地 址 。IPv4 地 址 
的 长 度 是 32 位 ， 网 际 协议 的 最 新 版 本 IPv6 有 128 位 的 地 址 空间 。 

数据 链 路 层 涉 及 局 域 网 和 广域网 。LAN 和 WAN 可 以 是 有 线 的 也 可 以 是 无 线 的 。 以 太 
网 是 使 用 范围 最 广 的 有 线 局 域 网 协议 。 拨 号 上 网 服务 、DSL 和 有 线 网 络 大 都 使 用 点 
对 点 有 线 WAN。 无 线 WAN 由 无 线 以 太 网 组 成 。 蓝 牙 是 一 种 用 来 连接 小 范围 内 设备 
( 叫 作 小 配件 ) 的 无 线 LAN 技术 。WiMAX 是 一 个 未 来 可 用 于 代替 DSL 和 电缆 的 无 线 
接 人 网 络 。 

数据 必须 先 转换 成 电磁 信和 号 才能 传输 。 模 拟 数据 是 连续 的 并 使 用 连续 的 值 ， 数 字数 据 
有 离散 的 状态 并 取 离 散 的 值 。 数 数 转换 将 数字 数据 转换 成 数字 信号 ， 数 模 转换 是 将 数 
字数 据 转换 成 模拟 信和 号 的 过 程 。 模 数 转 换 是 对 模拟 信号 进行 采样 并 转换 成 数字 信和 号 的 
过 程 。 模 模 转 换 指 将 模拟 数据 转换 成 模拟 信号。 

传输 介质 在 物理 层 之 下 。 导 向 介质 为 设备 之 间 提 供 物 理 通道 。 双 绞 线 、 同 轴 电 缆 、 光 
纤 电 缆 是 现在 流行 的 导向 介质 。 非 导向 介质 (自由 空间 ) 在 不 使 用 物理 导体 的 前 提 下 


传输 电磁 波 。 
练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相 
关 测 验 题 以 检测 对 本 章 内 容 的 理解 。 


复习 题 
Q6-1 本 章 讨论 的 需要 遵循 达成 双向 通信 的 协议 分 层 的 首要 原则 是 什么 ? 
Q6-2 在 TCP/IP 协议 族 中 ， 当 我 们 考虑 应 用 层 的 逻辑 连接 时 ， 发 送 方 和 接收 方 网 站 的 相同 对 象 是 


， 什 么 ? 
Q6-3 使 用 TCP/P 协议 族 的 一 台 主 机 和 另 一 台 主 机 通信 时 ， 在 以 下 各 层 中 发 送 或 接收 的 数据 单元 分 
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Q6-4 


Q6-5 


Q6-6 


Q6-7 


Q6-8 


Q6-9 


Q6-10 


Q6-11 
Q6-12 
Q6-13 
Q6-14 
Q6-15 
Q6-16 


Q6-17 
Q6-18 
Q6-19 
Q6-20 
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别 是 什么 ? 

a. 应 用 层 b. 网 络 层 c. 数据 链 路 层 
下 列 哪 个 数据 单元 以 帧 来 封装 ? 

a. 用 户 数据 报 b. 数据 报 c. 段 

下 列 哪 个 数据 单元 从 用 户 数据 报 解 封 ? 

a. 数据 报 b, 段 c. 消息 

下 列 哪个 数据 单元 有 应 用 层 的 消息 加 上 第 四 层 的 头 ? 

a. 帧 b. 用 户 数 据 报 c. 位 

在 以 下 各 层 中 各 使 用 何 种 地 址 (标识 符 ) 类 型 ? 

a. 应 用 层 b. 网 络 层 c. 数据 链 路 层 


在 周末 ，Alice 经 常 要 通过 她 的 笔记 本 电脑 访问 保存 在 办 公 室 台式 机 上 的 文件 。 上 周 她 在 办 公 
室 台式 机 上 安装 了 一 个 FTP 服务 器 程序 的 副本 ， 在 家 里 的 笔记 本 电脑 上 安装 了 FTP 客户 机 程 
序 的 副本 。 她 很 失望 周末 无 法 访问 到 她 的 文件 。 这 可 能 出 现 什么 差错 了 ? 

大 多 数 安装 在 个 人 计算 机 上 的 操作 系统 带 有 几 个 客户 端 进 程 ， 但 通常 没有 服务 器 进程 ， 请 解释 
原因 。 

新 的 应 用 程序 将 会 使 用 客户 机 - 服务 器 模式 设计 。 如 果 仅 有 少量 消息 需要 在 客户 机 和 服务 器 
之 间 交 换 ， 且 不 用 担心 消息 丢失 或 损坏 ， 你 推荐 哪 种 传输 层 协 议 呢 ? 

为 什么 网 络 层 的 职责 是 路 由 ? 换言之 ， 为 什么 路 由 不 能 在 传输 层 或 数据 链 路 层 实现 ? 

请 区 分 网 络 层 的 通信 和 数据 链 路 层 的 通信 。 

什么 是 拨号 调制 解 调 器 技术 ? 列 出 本 章 讨 论 过 的 通用 调制 解 调 器 标准 ， 给 出 它们 的 数据 速率 。 
为 什么 蓝牙 通常 被 称 为 无 线 个 域 网 (WPAN)， 而 不 是 无 线 局 域 网 ? 

当 频 率 给 定时 ， 如 何 求 正 弦 波 的 周期 ? 

以 下 哪个 物理 量 用 于 度量 信号 的 值 ? 

a, 振幅 b. 频率 c, 相位 

定义 模拟 传输 。 

在 TCP/IP 协议 族 中 ， 传 输 介质 在 什么 位 置 ? 

指出 传输 介质 两 大 类 别 的 名 称 。 

导向 介质 的 三 大 类 别 是 什么 ? 


练习 题 


P6-1 


P6-2 


P6-3 


P6-4 


P6-5 


P6-6 


回答 以 下 有 关 图 6-5 所 示 从 Maria 到 Ann 通信 时 的 问题 : 

a. 在 Maria 的 站 点 ， 由 第 一 层 到 第 二 层 提供 了 什么 服务 ? 

b. 在 Ann 的 站 点 ， 由 第 一 层 到 第 二 层 提供 了 什么 服务 ? 

回答 以 下 有 关 图 6-5 所 示 从 Maria 到 Ann 通信 时 的 问题 : 

a, 在 Maria 的 站 点 ， 由 第 二 层 到 第 三 层 提 供 了 什么 服务 ? 

b, 在 Ann 的 站 点 ， 由 第 二 层 到 第 三 层 提供 了 什么 服务 ? 

假设 连接 到 因特网 的 主机 在 2010 年 是 5 亿 台 。 这 个 数字 以 每 年 20% 的 速度 增长 ， 到 2020 年 主 
机 数量 是 多 少 ? 

假设 系统 使 用 5 个 协议 层 。 如 果 应 用 程序 创建 了 一 个 100 字 节 的 消息 ， 并 且 每 层 (包括 第 一 层 
和 第 五 层 ) 添加 一 个 10 字 节 的 报头 到 数据 单元 中 ， 该 系统 的 效率 (应 用 层 的 字 节 数 与 要 传输 的 
字 节 数 的 比率 ) 如 何 ? 

与 下 列 TCP/IP 协议 族 一 或 多 层 相 匹配 的 是 : 

a. 线路 的 确定 b. 连接 到 传输 介质 。“c. 为 最 终 用 户 提供 服务 

与 下 列 TCP/IP 协议 族 一 或 多 层 相 匹配 的 是 : 
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a. 创建 用 户 数据 报 。 “bb. 负责 处 理 毗 邻 节 点 间 的 帧 
c. 把 比特 转换 为 电磁 信和 号 
P6-7 ”在 我 们 生活 的 很 多 方面 都 能 发 现 协议 分 层 ， 例 如 航空 旅行 。 设 想 你 假期 要 去 度假 胜地 旅行 。 在 
当地 机 场 起 飞 之 前 你 需要 办 些 手续 ， 到 度假 胜地 机 场 落 地 后 也 需要 办 些 手 续 。 请 指出 用 于 往返 
旅行 的 协议 分 层 ， 使 用 诸如 行李 检查 /认领 、 登 机 /出 机 、 起 飞 / 降 落 。 
P6-8 在 因特网 中 ， 我 们 把 局 域 网 技术 更 新 了 。TCP/IP 协议 族 的 哪些 层 需要 变更 ? 
P6-9 比较 16 位 IP 地 址 (0~65 535) 和 32 位 卫 地 址 (0 一 4 294 967 295 ) 的 范围 ， 为 什么 我 们 需 
要 IP 地 址 有 如 此 大 的 范围 ， 但 端口 号 范围 却 相 对 较 小 呢 ? 
P6-10 使 用 二 进 制 表示 法 ， 重 写 以 下 地 址 : 
a. 110.11.5.88 b. 12.74.16.18 c. 201.24.44.32 
P6-11 使 用 带 点 的 十 进 制 表示 法 ， 重 写 以 下 IP 地 址 ; 
a. 01011110 10110000 01110101 00010101 ”b. 10001001 10001110 11010000 00110001 
c.01010111 10000100 00110111 00001111 
P6-12 下 列 以 太 网 地 址 等 价 的 十 六 进 制 形式 是 什么 ? 
01011010 00010001 01010101 00011000 10101010 00001111 
P6-13 一 个 设备 以 1000 bps 的 速率 发 送 数 据 。 
a. 发 送 10 位 用 多 长 时 间 ? b. 发 送 一 个 字符 (8 位 ) 用 多 长 时 间 ? 
c, 发 送 100 000 个 字符 的 文件 用 多 长 时 间 ? 
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这 是 本 书 讨论 计算 机 软件 的 第 一 章 。 在 本 章 中 ， 我 们 将 展示 操作 系统 在 计算 机 中 的 作用 。 
目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 ; 

。 理解 操作 系统 在 计算 机 中 的 作用 ; 

。 给 出 操作 系统 的 定义 ; 

。 理解 把 操作 系统 调和 人 内 存 的 自 举 过 程 ; 

。 列 出 操作 系统 的 组 成 部 分 ; 

。 讨论 操作 系统 中 内 存 管理 器 的 作用 ; 

。 讨论 操作 系统 中 进程 管理 器 的 作用 ; 

。 讨论 操作 系统 中 设备 管理 器 的 作用 ; 

。 讨论 操作 系统 中 文件 管理 器 的 作用 ; 

。 理解 三 种 常见 操作 系统 UNIX、Linux 和 Windows 的 主要 特点 。 


7.1 引言 
计算 机 系统 是 由 两 个 主要 部 分 组 成 的 : 硬件 和 软件 。 硬 件 是 计算 机 的 物理 设备 。 软 件 则 
是 使 得 硬件 能 够 正常 工作 的 程序 的 集合 。 计 算 机 软件 分 成 两 大 类 ， 操作 系统 和 应 用 程序 
(图 7-1 )。 应 用 程序 使 用 计算 机 硬件 来 解决 用 户 的 问题 。 另 
一 方面 ， 操 作 系 统 则 控制 计算 机 系统 用 户 对 硬件 的 访问 。 


7.1.1 操作 系统 


操作 系统 是 一 个 非常 复杂 的 系统 ， 因 此 很 难 给 予 它 一 
个 普遍 认同 的 简单 定义 。 在 这 里 列举 一 些 常见 的 定义 ee 

。 操 作 系 统 是 介 于 计算 机 硬件 和 用 户 (程序 或 人 ) 之 
间 的 接口 。 

。 操 作 系统 是 一 种 用 来 使 得 其 他 程序 更 加 方便 有 效 运行 的 程序 (或 程序 集 )。 

。 操作 系统 作为 通用 管理 程序 管理 着 计算 机 系统 中 每 个 部 件 的 活动 ， 并 确保 计算 机 系统 
中 的 硬件 和 软件 资源 能 够 更 加 有 效 地 使 用 。 当 出 现 资源 使 用 冲突 时 ， 操 作 系统 应 能 够 
及 时 处 理 ， 排 除 冲突 。 


操作 系统 是 计算 机 硬件 和 用 户 程序 和 人 ) 之 间 的 接口， 它 使 得 其 他 程序 更 加 方便 
有 效 地 运行 ， 并 能 方便 地 对 计算 机 硬件 和 软件 资源 进行 访问 。 和 


操作 系统 的 两 个 主要 设计 目标 : 
。 有效 地 使 用 硬件 。 
。 容易 地 使 用 资源 。 
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7.1.2 自 举 过 程 


基于 上 面 的 定义 ， 操 作 系 统 为 其 他 程序 提供 支持 。 例 如 ， 它 负责 把 其 他 程序 装 人 内 
存 ， 以 便 运行 。 但 是 ， 操 作 系 统 本 身 也 是 程序 ， 它 需要 被 装 人 内 存 和 运行 ， 这 个 困境 如 何 解 
决 呢 ? 

如 果 使 用 ROM 技术 把 操作 系统 存储 (由 制造 商 完成 ) 在 内 存 中 ， 这 个 问题 就 能 解决 。 
CPU (参见 第 5 章 ) 的 程序 计数 器 可 以 被 设置 为 这 个 ROM 的 开始 处 。 当 计算 机 被 加 电 时 ， 
CPU 从 ROM 中 读 取 指令 ， 执 行 它 们 。 但 这 种 解决 方案 是 非常 低 效 的 ， 因 为 内 存 的 很 大 一 部 
分 需要 由 ROM 构成 ， 而 不 能 被 其 他 程序 使 用 。 如 今 的 技术 是 仅 需 要 分 配 小 部 分 的 内 存 给 部 
分 操作 系统 。 

如 今 使 用 的 解决 方案 采用 两 阶段 过 程 。 很 小 一 部 分 内 存 用 ROM 构成 ， 其 中 存 有 称 为 自 
举 程序 的 小 程序 。 当 计算 机 被 加 电 时 ，CPU 计数 器 被 设置 为 自 举 程序 的 第 一 条 指令 ， 并 执 
行程 序 中 的 指令 。 这 个 程序 唯一 的 职责 就 是 把 操作 系统 本 身 (需要 启动 计算 机 的 那 部 分 ) 装 
人 RAM 内 存 。 当 装 人 完成 后 ，CPU 中 的 程序 计数 器 就 被 设置 为 RAM 中 操作 系统 的 第 一 条 
指令 ， 操 作 系 统 就 被 执行 。 图 7-2 说 明了 自 举 过 程 。 


ROM 





1. 自 举 程序 运行 





2. 操 作 系 统 被 装 入 ot 
3. 操 作 系 统 运行 内 存 
图 7-2 自 举 过 程 
7.2 演化 
操作 系统 已 经 经 历 了 很 长 的 一 段 发 展 历 程 ， 我 们 将 在 下 面 加 以 总 结 。 
7.2.1 批 处 理 系 统 


批 处 理 系统 设计 于 20 世纪 50 年 代 ， 目 的 是 控制 大 型 计算 机 。 当 时 计算 机 十 分 庞大 ,用 
穿孔 卡片 进行 输入 数据 ， 用 行 式 打印 机 输出 结果 ， 用 磁带 设备 作为 辅助 存储 介质 。 

每 个 运行 的 程序 叫 作 一 个 作业 。 想 要 运行 程序 的 程序 员 通 过 穿孔 卡片 将 程序 和 数据 输入 
计算 机 ， 并 向 控制 器 发 出 作业 请 求 。 穿 孔 卡 片 由 操作 员 处 理 。 如 果 程 序 运行 成 功 ， 打 印 结果 
将 传 给 程序 员 ， 如 果 不 成 功 ， 则 报错 。 

这 个 时 代 的 操作 系统 非常 简单 : 它们 只 保证 计算 机 所 有 资源 被 从 一 个 作业 转换 到 男 一 个 


作业 。 


7.2.2 分 时 系统 


为 了 有 效 使 用 计算 机 资源 ， 多 道 程序 的 概念 被 引入 。 它 可 以 将 多 个 作业 同时 装 入 内 存 ， 
并 且 仅 当 该 资源 可 用 时 分 配给 需要 它 的 作业 。 例 如 ， 当 一 个 程序 正 使 用 输入 /输出 设备 时 ， 
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CPU 则 处 于 空闲 状态 ， 并 可 以 供 其 他 程序 使 用 。 我 们 将 在 本 章 后 面 详 细 介绍 多 道 程序 。 

多 道 程序 带 来 了 分 时 的 概念 : 资源 可 以 被 不 同 的 作业 分 享 。 每 个 作业 可 以 分 到 一 段 时 间 
来 使 用 资源 。 因 为 计算 机 运行 速度 很 快 ， 所 以 分 时 系统 对 于 用 户 是 隐藏 的 ， 每 个 用 户 都 感觉 
整个 系统 在 为 自己 服务 。 

最 终 利 用 分 时 技术 的 多 道 程序 极 大 地 改进 了 计算 机 的 使 用 效率 。 但 是 ， 它 们 需要 有 一 个 
更 加 复杂 的 操作 系统 ， 它 必须 可 以 调度 : 给 不 同 的 程序 分 配 资源 并 决定 哪 一 个 程序 什么 时 候 
使 用 哪 一 种 资源 。 在 这 个 时 代 中 用 户 和 计算 机 的 关系 也 改变 了 。 用 户 可 以 直接 与 系统 进行 交 
互 而 不 必 和 通过 操作 员 。 一 个 新 的 术语 一 一 进程 也 随 之 产生 。 一 个 作业 是 一 个 要 运行 的 程序 ， 
一 个 进程 则 是 在 内 存 中 等 待 分 配 资源 的 程序 。 


7.2.3 个 人 系统 
当 个 人 计算 机 产生 后 ， 需 要 有 一 类 适合 这 类 计算 机 的 操作 系统 。 于 是 ， 单 用 户 操作 系统 
就 应 运 而 生 了 ， 如 DOS (磁盘 操作 系统 )。 


7.2.4 ”并 行 系统 

人 们 对 更 快 和 更 有 效 的 需求 导致 了 并 行 系统 的 设计 : 在 同一 计算 机 中 安装 了 多 个 CPU， 
每 个 CPU 可 以 处 理 一 个 程序 或 者 一 个 程序 的 一 部 分 。 这 意味 着 很 多 任务 可 以 并 行 地 人 处理 而 
不 再 是 串 行 处 理 。 当 然 这 种 操作 系统 要 比 单 CPU 的 操作 系统 复杂 得 多 。 


7.2.5 ”分 布 式 系统 , 

网 络 化 和 网 络 互联 的 发 展 (正如 我 们 在 第 6 章 所 看 到 的 那样 ) 扩大 了 操作 系统 的 内 涵 。 
一 个 以 往 必须 在 一 台 计 算 机 上 运行 的 作业 现在 可 以 由 远 隔 千里 的 多 台 计 算 机 共同 完成 。 程 序 
可 以 在 一 台 计算 机 上 运行 一 部 分 而 在 男 一 台 计 算 机 上 运行 男 一 部 分 ， 只 要 它们 通过 网 络 ( 例 
如 因特网 ) 连接 即 可 。 资 源 可 以 是 分 布 式 的 ， 一 个 程序 需要 的 文件 可 能 分 布 在 世界 的 不 同 地 
方 。 分 布 式 系统 结合 了 以 往 系统 的 特点 和 新 的 功能 ， 例 如 安全 控制 。 


7.2.6 ”实时 系统 

实时 系统 是 指 在 特定 时 间 限 制 内 完成 任务 。 它 们 被 用 在 实时 应 用 程序 中 ， 这 些 应 用 程 
序 监 控 、 响 应 或 控制 外 部 过 程 或 环境 。 在 交通 控制 、 病 人 监控 或 军事 控制 系统 中 可 以 找到 
实时 系统 的 例子 。 应 用 程序 有 时 可 以 是 作为 大 系统 一 部 分 的 艇 人 式 系统 ， 如 汽车 中 的 控制 
系统 。 

实时 操作 系统 的 需求 通常 与 通用 系统 的 需求 是 不 同 的 。 由 于 这 个 原因 ， 在 本 章 中 我 们 不 
讨论 它们 。 


7.3 组 成 部 分 

现在 的 操作 系统 十 分 复杂 ， 它 必须 可 以 管理 系统 中 的 不 同 资源 。 它 像 是 一 个 有 多 个 上 层 
部 门 经 理 的 管理 机 构 ， 每 个 部 门 经 理 负责 自 己 的 部 门 管理 ， 并 且 相互 协调 。 现 代 操 作 系 统 至 
少 具 有 以 下 4 种 功能 ; 内 存 管理 、 进 程 管理 、 设 备 管理 、 文 件 管理 。 就 像 很 多 组 织 有 一 个 部 
门 不 归 任 何 经 理 管理 一 样 ， 操 作 系统 也 有 这 样 一 个 部 分 ， 称 为 用 户 界面 或 命令 解释 程序 ， 它 
负责 操作 系统 与 外 界 的 通信 。 图 7-3 显示 了 操作 系统 的 组 成 部 分 。 
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7.3.1 用 户 界 面 


每 个 操作 系统 都 有 用 户 界面 ， 即 指 用 来 接收 用 户 (进程 ) 的 输入 并 向 操作 系统 解释 这 些 
请 求 的 程序 。 一 些 操作 系统 (比如 UNIX) 的 用 户 界 面 ， 被 称 作 命令 解释 程序 ( shell)。 在 其 
他 操作 系统 中 ， 则 被 称 为 窗口 ， 以 指明 它 是 一 个 由 菜单 驱动 的 并 有 着 GUI ( 图形 用 户 接 口 ) 
的 部 件 。 


7.3.2 内存 管理 器 


现在 计算 机 操作 系统 的 一 个 重要 职责 是 内 存 管理 。 计 算 机 中 存储 器 的 容量 近年 来 得 到 激 
增 ， 同 样 所 处 理 的 程序 和 数据 也 越 来 越 大 。 内 存 分 配 必须 进行 管理 以 避免 “内 存 洲 出 ”的 错 
误 。 操 作 系统 按照 内 存 管理 可 以 分 为 两 大 类 : 单 道 程序 和 多 道 程序 。 
1. 单 道 程序 
单 道 程序 属于 过 去 ， 但 它 还 是 值得 学 习 ， 因 为 它 有 助 于 理解 多 道 程序 。 在 单 道 程序 中 ， 
大 多 数 内 存 用 来 装载 单一 的 程序 (我 们 考虑 数据 作为 程序 的 一 个 部 分 被 程序 处 理 )， 仅 仅 一 
小 部 分 用 来 装载 操作 系统 。 在 这 种 配置 下 ， 整 个 程序 装 入 内 存 运行 ， 运 行 
结束 后 ， 程 序 区 域 由 其 他 程序 取代 (图 7-4 )。 
这 里 内 存 管理 器 的 工作 是 简单 明了 的 ， 即 将 程序 载 人 人 内存、 运行 它 、 
再 装 人 新 程序 。 但 是 ,在 技术 方面 仍然 有 很 多 问题 : 
。 程序 必须 能 够 载 人 内 存 。 如 果 内 存 容量 比 程序 小 ， 程 序 将 无 法 
运行 。 
。 当 一 个 程序 正在 运行 时 ， 其 他 程序 不 能 运行 。 一 个 程序 在 执行 过 程 
中 经 常 需要 从 输入 设备 得 到 数据 ， 并 且 把 数据 发 送 至 输出 设备 。 但 
输入 /输出 设备 的 速度 远 远 小 于 CPU， 所 以 当 输入 /输出 设备 运行 
时 ，CPU 处 于 空闲 状态 。 而 此 时 由 于 其 他 程序 不 在 内 存 中 ，CPU 
不 能 其 服务 。 这 种 情况 下 CPU 和 内 存 的 使 用 效率 很 低 。 
2. 多 道 程序 
在 多 道 程序 下 ， 同 一 时 刻 可 以 装 入 多 个 程序 并 且 能 够 同时 被 执行 。 
CPU 轮流 为 其 服务 。 图 7-5 给 出 了 多 道 程序 的 内 存 分 配 。 ee 
a 60 年 代 开 始 ， 多 道 程序 已 经 经 过 了 一 系列 改进 ， 如 图 7-6 图 7.5 多 道 程序 
示 。 
我 们 将 在 下 面 几 节 对 每 种 模式 进行 简要 讨论 。 有 两 种 技术 属于 非 交 换 范 畴 ， 这 意味 着 程 
序 在 运行 期 间 始终 驻 留 在 内 存 中 。 另 外 两 种 技术 属于 交换 范畴 。 也 就 是 说 ， 在 运行 过 程 中 ， 


图 7-3 操作 系统 的 组 成 部 分 





内 存 
图 7-4 单 道 程序 
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程序 可 以 在 内 存 和 硬盘 之 间 多 次 交换 数据 。 





口 分 区 口 请 求 分 页 
口 分 页 口 请 求 分 段 


图 7-6 多 道 程序 的 类 型 


分 区 调度 
多 道 程序 的 第 一 种 技术 称 为 分 区 调度 。 在 这 种 模式 中 ， 内 存 被 分 为 不 定 长 的 几 个 分 区 。 


每 个 部 分 或 分 区 保存 一 个 程序 。CPU 在 各 个 程序 之 间 交 替 服 务 。 它 由 一 个 程序 开始 ， 执 行 
一 些 指令 ， 直 到 有 输入 /输出 操作 或 者 分 配给 程序 的 时 限 到 达 为 止 。CPU 保存 最 近 使 用 的 指 
令 所 分 配 的 内 存 地 址 后 转 人 下 一 个 程序 。 对 下 一 个 程序 采用 同样 的 步骤 反复 执行 下 去 。 当 所 
有 程序 服务 完毕 后 ， 再 转 回 第 一 个 程序 。 当 然 ，CPU 可 以 进行 优先 级 管理 ， 用 于 控制 分 配 


给 每 个 程序 的 CPU 时 间 (图 7-7 )。 





a) CPU 开始 执行 程序 ! b) CPU 开始 执行 程序 2 
图 7-7 分 区 调度 


在 这 种 技术 下 ， 每 个 程序 完全 载 人 内 存 ， 并 占用 连续 的 地 址 。 分 区 调度 改进 了 CPU 的 
使 用 效率 ， 但 仍 有 以 下 一 些 问 是 ， 
。 分 区 的 大 小 必须 由 内 存 管理 只 预先 决定 。 如 果 分 区 小 了 ， 有 的 程序 就 不 能 载 人 内 存 。 
如 果 分 区 大 了 ， 就 会 出 现 空闲 区 。 
。 即 使 分 区 在 刚 开始 时 比较 合适 ， 但 随 着 新 程序 的 交换 载 人 内 存 后 有 可 能 出 现 空闲 区 。 
。 当空 闲 区 过 多 时 ， 内 存 管理 器 能 够 紧缩 分 区 并 删除 空 用 区 和 创建 新 区 ， 但 这 将 增加 系 
统 额 外 开销 。 
分 页 调度 eh 
分 页 调度 提高 了 分 区 调度 的 效率 。 在 分 页 调度 下 ， 
内 存 被 分 成 大 小 相等 的 若干 个 部 分 ， 称 为 帧 。 程 序 则 被 
分 为 大 小 相等 的 部 分 ， 称 为 页 。 页 和 由 的 大 小 通常 是 一 [En 
样 的 ， 并 且 与 系统 用 于 从 存储 设 备 中 提取 信息 的 块 大 小 [下 
相等 (图 7.8 )。 一 是 一 
页 被 载 人 内 存 中 的 帧 。 如 果 一 个 程序 有 3 页 ， 它 
就 在 内 存 中 占用 3 个 帧 。 在 这 种 技术 下 ， 程 序 在 内 存 中 “国有 
不 必 是 连续 的 两 个 连续 的 页 可 以 占用 内 存 中 不 连续 的 图 7-8 分 页 调度 
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两 个 帧 。 分 页 调度 对 分 区 调度 的 优势 在 于 ， 一 个 需要 6 个 帧 的 程序 可 以 代替 两 个 各 占有 不 连 
续 的 3 个 帧 的 程序 。 而 不 必 等 到 有 6 个 连续 的 帧 出 现 后 再 载 人 内 存 。 

分 页 调度 在 一 定 程度 上 提高 了 效率 ,但 整个 程序 仍 需 要 在 运行 前 全 部 载 人 内 存 。 这 意味 
着 在 只 有 4 个 不 连续 帧 时 ， 一 个 需要 6 个 空闲 帧 的 程序 是 不 能 载 人 的 。 

请 求 分 页 调度 

分 页 调度 不 需要 程序 装载 在 连续 的 内 存 中 ， 但 仍 需要 程序 整体 载 人 内 存 中 运行 。 请 求 分 
页 调度 改变 了 后 一 种 限制 。 在 请 求 分 页 调度 中 ， 程 序 被 分 成 页 ， 但 是 页 可 以 依次 载 人 内 存 、 
运行 ， 然 后 被 另 一 个 页 代替 。 换 名 话说， 内存 可 以 同时 载 人 多 个 程序 的 页 。 此 外 ,来 自 同 一 
个 程序 的 连续 页 可 以 不 必 载 人 同一 个 帧 ， 一 个 页 可 以 载 人 任何 一 个 空闲 帧 。 图 7-9 显示 了 请 
求 分 页 调度 的 一 个 例子 。 两 页 来 自 程序 A， 一 页 来 自 程序 B， 一 页 来 自 程序 C， 这 4 页 在 内 
存 中 。 

请 求 分 段 调度 

类 似 于 分 页 调度 的 技术 是 分 段 调 度 。 在 分 页 调度 中 ， 不 像 程 序 员 以 模块 来 考虑 程序 ， 程 
序 实际 是 分 为 大 小 相等 的 页 。 你 将 在 后 面 的 章节 中 看 到 ， 程 序 通常 由 主 程序 和 子 程序 组 成 ， 
在 请 求 分 段 调度 中 ， 程 序 将 按 程 序 员 的 角度 划分 成 段 ， 它 们 载 人 内 存 中、 执行 ， 然 后 被 来 自 
同一 程序 或 其 他 程序 的 模块 所 代替 。 图 7-10 显示 了 请 求 分 段 调度 的 一 个 例子 。 因 为 在 内 存 
中 的 段 是 等 长 的 ， 所 以 段 的 一 部 分 可 能 是 空 的 。 





图 7-9 请求 分 页 调度 图 7-10 ”请求 分 段 调度 


请 求 分 页 和 分 段 调 度 

请 求 分 页 和 分 段 调度 结合 了 两 者 的 优点 以 提高 系统 效率 。 一 个 段 也 许 太 大 而 不 能 载 人 内 
存 中 的 空闲 区 。 内 存 可 以 分 成 很 多 帧 ， 一 个 模块 可 以 分 成 很 多 页 ， 依 次 装 人 内 存 运行 。 

3. 虚拟 内 存 

请 求 分 页 调度 和 请 求 分 段 调度 意味 着 当 程 序 
运行 时 ， 一 部 分 程序 驻 留 在 内 存 中 ， 一 部 分 则 放 
在 硬盘 上 。 这 就 意味 着 ， 例 如 ，10 MB 内 存 可 以 
运行 10 个 程序 。 每 个 程序 3 MB, 一 共 30 MB。 
任 一 时 候 10 个 程序 中 10 MB 在 内 存 中 ， 还 有 20 MB 
在 磁盘 上 。 这 里 实际 上 只 有 10 MB 内 存 但 却 有 30 MB 
的 虚拟 内 存 。 如 图 7-11 所 示 展 示 了 这 个 概念 。 虐 
拟 内 存 意味 着 请 求 分 页 调度 、 请 求 分 段 调度 ， 或 
两 种 都 有 ， 如 今 几 乎 所 有 的 操作 系统 都 使 用 了 该 


技术 。 





图 7-11 虚拟 内 存 
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7.3.3 ”进程 管理 器 

操作 系统 的 第 二 个 功能 是 进程 管理 ， 在 介绍 该 概念 之 前 ， 我 们 先 定义 一 些 术语 。 

1. 程序 、 作 业 和 进程 

现代 操作 系统 关于 指令 集 有 三 个 术语 : 程序 、 作 业 和 进程 。 尽 管 这 些 术语 比较 模糊 ， 并 
且 不 同 的 操作 系统 对 于 它们 的 定义 并 不 一 致 ， 我 们 还 是 可 以 作出 非 正 式 的 定义 。 

程序 

程序 是 由 程序 员 编写 的 一 组 稳定 的 指令 ， 存 在 磁盘 (或 磁带 ) 上 ， 它 可 能 会 也 可 能 不 会 
成 为 作业 。 

作业 

从 一 个 程序 被 选中 执行 ， 到 其 运行 结束 并 再 次 成 为 一 个 程序 的 这 段 过程 中 ， 该 程序 称 为 
作业 。 在 整个 过 程 中 ， 作 业 可 能 会 或 不 会 被 执行 ， 或 者 驻 留 在 磁盘 上 等 待 调 人 内 存 ， 或 者 在 
内 存 中 等 待 CPU 执行 ， 或 者 驻 留 在 硬盘 或 内 存 中 等 待 一 个 输入 /输出 事件 ， 或 者 在 内 存 中 
等 待 直到 被 CPU 运行 。 在 所 有 这 些 情况 下 程序 才 称 为 作业 。 当 一 个 作业 执行 完毕 (正常 或 
不 正常 )， 它 又 变 成 程序 代码 并 再 次 驻 留 于 硬盘 中 ， 操 作 系 统 不 再 支配 该 程序 。 需 要 注意 的 
是 ， 每 个 作业 都 是 程序 ， 但 并 不 是 所 有 的 程序 都 是 作业 。 

进程 

进程 是 一 个 运行 中 的 程序 。 该 程序 开始 运行 但 还 未 结束 。 换 句 话 说 ， 进 程 是 一 个 驻 留 在 
内 存 中 运行 的 作业 ， 它 是 从 众多 等 待 作业 中 选取 出 来 并 装 和 内存 中 的 作业 。 一 个 进程 可 以 处 
于 运行 状态 或 者 等 待 CPU 调用 。 只 要 作业 装 人 内 存 就 成 为 一 个 进程 。 需 要 注意 的 是 ， 每 个 
进程 都 是 作业 ， 而 作业 未 必 是 进程 。 

2. 状态 图 

当 明 白 程 序 怎样 变 成 作业 和 作业 怎样 变 成 进程 时 ， 程 序 、 作 业 、 进 程 的 关系 也 就 很 明显 
了 。 状 态 图 显示 了 每 个 实体 的 不 同 状态 ， 图 7-12 中 用 框 线 将 这 三 者 分 开 。 
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图 7-12 程序 、 作 业 和 进程 分 界 状态 图 


一 个 程序 当 被 操作 系统 选中 时 就 成 为 作业 并 且 成 为 保持 状态 。 直 至 它 载 人 内 存 之 前 都 
保持 这 个 状态 。 当 内 存 可 以 整体 或 者 部 分 地 载 人 这 个 程序 时 ， 作 业 转 成 就 绪 状 态 ， 并 变 成 进 
程 。 它 在 内 存 中 保持 这 个 状态 直至 CPU 运行 它 ; 这 时 它 转 成 运行 状态 。 当 处 于 运行 状态 后 ， 
可 能 出 现下 面 三 种 情况 之 一 : 
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。 进程 运行 直至 它 需 要 1/0 资源 

。 进程 可 能 耗 尽 所 分 配 的 时 间 片 。 

。 进程 终止 。 

在 第 一 种 情况 下 ， 进 程 进入 等 待 状态 直至 输入 / 输出 结束 。 在 第 二 种 情况 下 ， 它 直接 进 
人 就 绪 状 态 。 在 第 三 种 情况 下 ， 它 进入 终止 状态 ， 并 且 不 再 是 进程 。 进 程 进入 终止 状态 前 在 
运行 、 等 待 、 就 绪 状 态 中 转换 。 注 意 ， 如 果 系 统 使 用 虚拟 内 存 ， 并 且 需 要 在 内 存 中 将 程序 交 
换 出 或 换 入 ， 状 态 图 可 能 更 加 复杂 。 

3. 调度 器 

将 一 个 作业 或 进程 从 一 个 状态 改变 为 男 一 个 状态 ， 进 程 管理 器 使 用 了 两 个 调度 器 : 作业 
调度 器 和 进程 调度 器 。 

作业 调度 器 

作业 调度 器 将 一 个 作业 从 保持 状态 转 和 人 就 绪 状态 ， 或 是 从 运行 状态 转 人 终止 状态 。 换 名 
三 如 ,作业 调度 器 负责 从 作业 中 创建 一 个 进程 和 终止 一 个 进程 。 图 7-13 给 出 了 作业 调度 器 
的 状态 关系 框图 。 

进程 调度 器 

进程 调度 器 将 一 个 进程 从 一 个 状态 转 人 男 
一 个 状态 。 当 一 个 进程 等 待 某 事件 发 生 时 ， 它 
使 这 一 进程 从 运行 状态 进入 等 待 状态 。 当 事件 
发 生 时 ， 进 程 将 从 等 待 状态 进入 就 绪 状 态 。 当 
一 个 进程 所 分 配 的 时 间 片 用 完 时 ， 这 个 进程 将 
从 运行 状态 进入 就 绪 状 态 。 当 CPU 准备 执行 这 





图 7-13 ”作业 调度 器 
个 进程 时 ， 进 程 调度 器 将 让 这 个 进程 从 就 绪 状 态 进 入 执行 状态 。 图 7-14 给 出 了 进程 调度 器 
的 状态 关系 框图 。 
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等待 2 
图 7-14 进程 调度 器 
其 他 调度 器 
一 些 操作 系统 使 用 其 他 类 型 的 调度 器 使 进程 之 间 的 转换 更 为 有 效 。 
4. 队列 


状态 图 显示 了 一 个 作业 或 进程 从 一 个 状态 进入 另 一 个 状态 。 事 实 上 ,会 有 很 多 的 作业 和 
进程 相互 竞争 计算 机 资源 。 例 如 ， 当 一 些 作业 进入 内 存 时 ， 其 他 的 就 必须 等 待 直到 有 了 可 用 
空间 。 或 者 当 一 个 进程 正在 使 用 CPU 时 ， 其 他 进程 就 必须 等 待 直到 CPU 空闲 为 止 。 为 处 理 
多 个 进程 和 作业 ， 进 程 管理 器 使 用 队列 (等 待 列表 )。 与 每 一 作业 或 进程 相关 的 是 存 有 这 些 
作业 和 进程 信息 的 作业 控制 块 或 进程 控制 块 。 进 程 管理 在 队列 中 存储 的 不 是 作业 或 进程 ， 而 
是 作业 或 进程 控制 块 。 作 业 和 进程 仍 保存 在 内 存 或 硬盘 中 ; 它们 因为 太 大 而 无 法 被 复制 到 队 
列 中 。 这 些 作 业 控制 块 或 进程 控制 块 就 是 等 待 中 的 作业 和 进程 的 代表 。 
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一 个 操作 系统 有 很 多 个 队列 。 例 如 ， 图 7-15 给 出 的 作业 和 进程 在 三 个 队列 里 循环 : 作 
业 队 列 、 就 绪 队 列 和 IO 队列 。 作 业 队 列 用 来 保存 那些 等 待 内 存 的 作业 。 就 绪 队 列 用 来 保存 
那些 已 经 在 内 存 中 准备 好 运行 但 在 等 待 CPU 的 进程 。IO 队列 用 来 保存 那些 正在 等 待 IO 设 
备 的 进程 (这 里 可 以 有 多 个 IO 队列 ， 每 一 个 对 应 一 个 输入 / 输出 设备 ， 这 里 为 了 简单 只 画 


出 一 个 )。 





图 7-15 进程 管理 队列 


进程 管理 器 可 以 用 多 种 策略 从 队列 中 选择 下 一 个 作业 或 进程 ， 可 以 是 先 人 先 出 《FIFO 小 
最 短 长 度 优先 、 最 高 优先 级 等 。 


5. 进程 同步 
所 有 的 进程 管理 的 思想 都 是 使 得 拥有 不 同 资源 的 不 同 进程 同步 。 只 要 资源 可 以 被 多 个 用 


户 (进程 ) 同时 使 用 ， 那 么 它 就 可 能 有 两 种 有 问题 的 状态 : 死 锁 和 饥饿 。 下 面 简略 说 明 一 下 
这 两 种 状态 。 


死 锁 
我 们 先 不 给 出 死 锁 的 正式 定义 ， 先 看 一 个 例子 。 假 定 有 两 个 进程 A 和 B， 进 程 A 已 经 


占有 了 一 个 名 为 Filel 的 文件 ( Filel 已 经 分 配给 了 A)， 而 它 只 有 得 到 另 一 个 名 为 File2 的 文 
件 (A 已 经 请 求 了 File2 ) 才能 够 释放 File1。 进 程 B 已 经 占有 了 File2 文件 (File2 已 经 分 配 
给 了 B)， 而 它 只 有 得 到 Filel 文件 (B 已 经 请 求 了 Filel ) 才能 够 释放 File2。 在 大 多 数 操作 
系统 中 ， 文 件 都 是 不 可 共享 的 ; 当 文件 被 一 个 进程 使 用 时 ， 将 不 能 再 被 别 的 进程 使 用 。 在 这 
种 情况 下 ， 如 果 没 有 强制 一 个 进程 释放 文件 的 防备 措施 ， 就 会 发 生死 锁 (图 7-16 )。 





图 7-16 死 锁 


图 7-17 用 窄 桥 来 模拟 死 锁 。 窄 桥 的 情况 与 死 锁 类 似 ， 因 为 资源 ( 桥 的 一 端 ) 被 一 辆 车 占 
用 ， 该 车 只 有 到 达 桥 的 另 一 端 才 会 释放 资源 ， 而 此 时 另 一 端正 被 另 一 辆 车 占用 着 。 反 之 亦 然 。 
死 锁 发 生 在 操作 系统 允许 一 个 进程 运行 ， 而 不 用 首先 检查 它 所 必需 的 资源 是 否 准备 好 ， 
是 否 允 许 这 个 进程 占有 资源 直到 它 不 需要 为 止 。 操 作 系统 中 需要 有 一 些 措 施 来 防止 死 锁 。 一 
种 解决 方法 是 当 所 需 资源 不 空闲 时 ， 不 允许 进程 运行 。 但 后 面 会 发 现 这 样 做 将 导致 另 一 种 问 
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题 。 另 一 种 解决 方法 是 限制 进程 占有 资源 的 时 间 。 





图 7-17 在 桥 上 的 死 锁 


信和 人 

死 锁 不 是 经 常 发 生 ， 死 锁 发 生 需 要 4 个 必要 条 件 : 

。 互 斥 。 一 个 资源 只 能 被 一 个 进程 占有 ; 

。 资源 占有 。 一 个 进程 占有 一 个 资源 ， 即 使 在 获取 其 他 资源 之 前 无 法 使 用 它 ; 

。 抢先 。 操 作 系 统 不 能 临时 对 资源 重新 分 配 ; 

。 循环 等 待 。 所 有 的 进程 和 资源 包含 在 一 个 循环 里 ， 如 图 7-16 所 示 。 

所 有 4 个 条 件 都 是 死 锁 发 生 所 必需 的 。 但 是 它们 只 是 必要 条 件 (不 是 充分 条 件 )， 也 就 
是 说 对 于 死 锁 来 说 它们 必须 同时 出 现 ， 但 它们 并 不 一 定 能 引起 死 锁 。 换 名 话说， 如果 它 们 其 
中 之 一 没有 出 现 ， 死 锁 不 会 发 生 。 这 样 就 给 我 们 提供 了 一 种 方法 来 防止 或 避免 死 锁 : 不 让 它 
们 中 的 某 一 条 件 发 生 。 

饥 俄 

饥饿 是 一 种 与 死 锁 相反 的 情况 。 它 发 生 在 当 操 作 系 统 对 进程 分 配 资源 有 太 多 限制 的 时 
候 。 例 如 ， 假 使 一 个 操作 系统 中 规定 一 个 进程 只 有 在 所 需 的 所 有 资源 都 为 其 占有 时 才能 执行 。 

在 图 7-18 中 ， 假 设 进程 A 需要 两 个 文件 Filel 和 File2。Filel 正在 被 进程 B 使 用 ， 
File2 正在 被 进程 E 使用。 进程 B 将 首先 终止 并 释放 File1， 但 进程 A 一直 不 能 执行 是 因为 
File2 一 直 不 被 释放 。 与 此 同时 ， 进 程 C 由 于 只 需要 Filel 而 被 允许 执行 。 这 时 进程 EE 终止 


且 释 放 File2， 但 进程 A 还 是 不 能 执行 ， 因 为 Filel 正 被 使 用 。 





c) 进程 A 仍 然 需 要 File1 和 Pile2 ( 包 饿 ) 
图 7-18 饥饿 
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Edsger Dijkstra 介绍 过 一 个 经 典 的 饥 饿 问题 。 五 个 哲学 家 围 坐 在 一 个 圆桌 前 (图 7-19 )， 
每 个 哲学 家 需要 用 两 只 簧 子 来 吃 碗 里 的 米饭 。 然 而 ， 有 一 
只 或 两 只 簧 子 可 能 被 邻 座 的 人 使 用 了 。 如 果 没 有 两 只 筷子 
同时 可 用 ， 有 一 位 哲学 家 将 饥 钱 。 

6. 设备 管理 加 

设备 管理 器 (或 者 是 输入 / 输出 管理 器 ) 负责 访问 输 
入 /输出 设备 。 在 计算 机 系统 中 输入 / 输出 设备 存在 着 数量 
和 速度 上 的 限制 。 由 于 这 些 设备 与 CPU 和 内 存 比 起 来 速度 全 日 
要 慢 很 多 ， 所 以 当 一 个 进程 访问 输入 / 输出 设备 时 ， 在 该 
归 时 间 内 这 些 设备 对 其 他 进程 而 言 是 不 可 用 的 。 设 备 管理 。 全 OO 
器 负责 让 输入 / 输出 设备 使 用 起 来 更 有 效 。 图 7.19 哲学 家 吃饭 问题 

对 设备 管理 器 细节 的 讨论 需要 掌握 有 关 操 作 系 统 原 
理 的 高 级 知识 ， 这 些 都 不 在 本 书 讨论 之 列 。 但 是 我 们 可 以 在 这 里 简要 地 列 出 设备 管理 器 的 
功能 。 

。 设备 管理 器 不 停 地 监视 所 有 的 输入 /输出 设备 ， 以 保证 它们 能 够 正常 运行 。 管 理 需 
同样 也 需要 知道 何 时 设备 已 经 完成 一 个 进程 的 服务 ， 而 且 能 够 为 队列 中 下 一 个 进程 
服务 。 

。 设备 管理 器 为 每 一 个 输入 / 输出 设备 维护 一 个 队列 ， 或 是 为 类 似 的 输入 / 输出 设备 维 
护 一 个 或 多 个 队列 。 例 如 ， 如 果 系 统 中 有 两 台 高 速 打印 机 ， 管 理 器 能 够 分 别 用 一 个 队 
列 维护 一 个 设备 ,或 是 用 一 个 队列 维护 两 个 设备 。 

。 设备 管理 器 控制 用 于 访问 输入 /输出 设备 的 不 同 策略 。 例 如 ， 可 以 用 先 人 先 出 法 来 维 
护 一 个 设备 ， 而 用 最 短 长 度 优先 来 维护 另 一 个 设备 。 


7.3.4 文件 管理 器 


现今 的 操作 系统 使 用 文件 管理 器 来 控制 对 文件 的 访问 。 对 文件 管理 器 细节 的 讨论 同样 需 
要 掌握 有 关 操 作 系 统 原 理 和 文件 访问 的 高 度 概 念 ， 这 些 超出 了 本 书 的 讨论 范围 。 我 们 将 在 第 
13 章 中 讨论 一 些 有 关 文 件 访问 的 问题 ， 但 这 对 于 了 解 文件 管理 器 实际 的 操作 还 不 够 。 下 面 
简 述 一 下 文件 管理 器 的 功能 : 
。 文件 管理 器 控制 文件 的 访问 。 只 有 那些 获得 允许 的 应 用 程序 才能 够 访问 ， 访 问 方式 也 
可 以 不 同 。 例 如 ， 一 个 进程 (或 一 个 调用 进程 的 用 户 ) 也 许可 以 读 取 文件 ， 但 却 不 多 
许 写 (改变 ) 操作 。 另 一 个 进程 也 许 被 允许 执行 文件 和 进程 ， 但 却 不 允许 读 取 文件 的 
内 容 。 
。 文件 管理 器 管理 文件 的 创建 、 删 除 和 修改 。 
。 文件 管理 器 可 以 给 文件 命名 。 
。 文件 管理 器 管理 文件 的 存储 怎样 存储 ， 存 在 哪里 等 。 
。 文件 管理 器 负责 归档 和 备份 。 


7.4 主流 操作 系统 
在 这 一 节 ， 我 们 将 介绍 一 些 常用 的 操作 系统 ， 以 促进 将 来 的 学 习 。 我 们 选择 三 种 计算 机 
用 户 熟 悉 的 操作 系统 : UNIX、Linux 和 Windows。 





春 作 夭 统 143 





7.4.1 UNIX 


UNIX 是 由 贝尔 实验 室 的 计算 机 科学 研究 小 组 的 Thomson 和 Ritchie 在 1969 年 首先 开 
发 出 来 的 。 从 那 时 起 ，UNIX 经 历 了 许多 版 本 。 它 是 一 个 在 程序 设计 员 和 计算 机 科学 家 中 较 
为 流行 的 操作 系统 。 它 是 一 个 非常 强大 的 操作 系统 ， 有 三 个 显著 的 特点 。 第 一 ，UNIX 是 一 
个 可 移植 的 操作 系统 ， 它 可 以 不 经 过 较 大 的 改动 而 方便 地 从 一 个 平台 移植 到 另 一 个 平台 。 原 
因 是 它 主 要 是 由 C 语言 编写 的 (而 不 是 特定 于 某 种 计算 机 系统 的 机 器 语言 )。 第 二 ，UINX 拥 
有 一 套 功 能 强大 的 工具 (命令 )， 它 们 能 够 组 合 起 来 (在 可 执行 文件 中 被 称 为 脚本 ) 去 解决 许 
多 问题 ， 而 这 一 工作 在 其 他 操作 系统 中 则 需要 通过 编程 来 完成 。 第 三 ， 它 具有 设备 无 关 性 ， 
因为 操作 系统 本 身 就 包含 了 设备 驱动 程序 ， 这 意味 着 它 可 以 方便 地 配置 来 运行 任何 设备 。 

UNIX 是 多 用 户 、 多 道 程序 、 可 移植 的 操作 系统 ， 它 被 设计 来 方便 编程 、 文 本 处 理 、 通 
信和 其 他 许多 希望 操作 系统 来 完成 的 任务 。 它 包含 几 百 个 简单 、 单 一 目的 的 函数 ， 这 些 函数 
能 组 合 起 来 完成 任何 可 以 想象 的 处 理 任务 。 它 的 灵活 性 通过 它 可 以 用 在 三 种 不 同 的 计算 环境 
中 而 得 到 证 明 ， 这 三 种 环境 为 :单机 个 人 环境 、 分 时 系统 和 客户 / 服务 器 系统 。 


_UNX 是 多 用 户 、 多 道 程序 ， 可 移植 的 操作 系统 ; 它 被 设计 用 来 方便 编程、 文本 处 理 、 通 信 。 


UNIX 结构 

UNIX 由 4 个 主要 部 分 构成 : 内核、 命令 解释 器 、 一 组 标准 工具 和 应 用 程序 。 这 些 组 成 
部 分 显示 在 图 7-20 中 。 

内 核 

内 核 是 UNIX 系统 的 心脏 。 它 包含 操作 系统 最 基 
本 的 部 分 : 内 存 管理 、 进 程 管理 、 设 备 管理 和 文件 管 
理 。 系 统 所 有 其 他 部 分 均 调用 内 核 来 执行 这 些 服务 。 

命令 解释 器 

命令 解释 器 是 UNIX 中 用 户 最 可 见 的 部 分 。 它 
接收 和 解释 用 户 输入 的 命令 。 在 许多 方面 ， 这 使 它 成 
为 UNIX 结构 的 最 重要 的 组 成 部 分 。 它 肯定 也 是 用 户 
最 知道 的 部 分 。 为 了 在 系统 做 任何 事情 ， 我 们 必须 向 
命令 解释 器 输入 命令 。 如 果 命 令 需 要 一 个 工具 ， 命 令 
解释 器 将 请 求 内 核 执行 该 工具 。 如 果 命 令 需 要 一 个 应 
用 程序 ， 命 令 解 释 器 需要 内 核 运行 它 。 有 些 操作 系统 。 图 720 UNDX 操作 系统 的 组 成 部 分 
(如 UNIX) 有 几 种 不 同 的 命令 解释 器 。 

工具 

UNIX 中 有 几 百 个 工具 。 工 具 是 UNIX 标准 程序 ， 它 为 用 户 提 供 支 持 过 程 。 常 用 的 三 个 
工具 是 : 文本 编辑 器 、 搜 索 程 序 和 排序 程序 。 

许多 系统 工具 实际 上 复杂 的 应 用 程序 。 例 如 ，UNIX 的 电子 邮件 系统 被 看 成 一 个 工具 ， 
就 像 三 种 常见 文本 编辑 器 : vi、emacs 和 pico。 所 有 这 4 个 工具 本 身 都 是 大 的 系统 。 其 他 工 
具 是 简短 函数 。 例 如 ，list (ls) 工具 显示 磁盘 目录 中 的 文件 。 

应 用 

UNIX 的 应 用 是 指 一 些 程 序 ， 它 们 不 是 操作 系统 发 布 中 的 标准 部 分 。 它 们 是 由 系统 管理 
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员 、 专 职 程序 员 或 用 户 编写 的 ， 提 供 了 对 系统 的 扩展 能 力 。 事 实 上 ， 许 多 标准 工具 自 多 年 前 
都 是 作为 应 用 出 现 的 ， 后 来 被 证 明 非常 有 用 ， 现 在 就 成 了 系统 的 一 部 分 。 


7.4.2 Linux 

在 1991 年 ,芬兰 Helsinki 大 学 的 学 生 Linus Torvalds 开发 了 一 个 新 的 操作 系统 ， 这 就 
是 如 今 所 知 的 Linux。 初 始 内 核 (与 UNIX 小 子 集 相似 ) 如 今 成 长 为 全 面 的 操作 系统 。1997 
年 发 布 的 Linus 2.0 内 核 成 为 商业 操作 系统 ， 它 具有 传统 UNIX 的 所 有 特性 。 

1. 组 成 

Linux 有 下 列 组 成 部 分 。 

内 核 

内 核 负 责 处 理 所 有 属于 内 核 的 职责 ， 如 内 存 管理 、 进 程 管理 、 设 备 管理 和 文件 管理 。 

系统 库 

系统 库 含 有 一 组 被 应 用 程序 使 用 的 函数 (包括 命令 解释 器 )， 用 于 与 内 核 交 互 。 

系统 工具 

系统 工具 是 使 用 系统 库 提供 的 服务 ， 执 行 管 理 任务 的 各 个 程序 。 

2. 网 络 功能 

Linux 支持 第 6 章 中 讨论 的 标准 因特网 协议 。 它 支持 三 层 : 套 接 字 接口 、 协 议 驱 动 和 网 
络 设备 驱动 。 

3. 安全 

Linux 的 安全 机 制 提供 了 传统 上 为 UNIX 定义 的 安全 特性 。 如 身份 验证 和 访问 控制 。 


7.4.3 Windows 


20 世纪 80 年 代 后 期 ， 在 Dave Cutler 的 领导 下 ， 微 软 开始 开发 蔡 代 MS-DOS (微软 磁 
盘 操 作 系 统 ) 的 新 的 单 用 户 操作 系统 。Windows 就 是 结果 。 后 来 又 有 几 个 Windows 的 版 本 ， 
我 们 统称 这 些 版 本 为 Windows。 

1. 设计 目标 

微软 发 布 的 设计 目标 是 : 可 扩展 性 、 可 移植 性 、 可 人 靠 性 、 兼 容 性 和 性 能 。 

可 扩展 性 

Windows 被 设计 成 具有 多 层 的 模块 化 体系 结构 。 意 图 是 允许 高 层 随时 间 而 改变 ， 而 不 
影响 底层 。 

可 移植 性 

像 UNIX 一 样 ，Windows 是 用 C 或 C++ 编写 的 ， 这 个 语言 是 独立 于 它 所 运行 的 计算 机 
的 机 器 语言 的 。 

可 靠 性 

Windows 被 设计 成 能 处 理 包 括 防止 恶意 软件 的 错误 条 件 。 

兼容 性 

Windows 被 设计 成 能 运行 为 其 他 操作 系统 编写 的 程序 ， 或 Windows 早期 版 本 。 


性 能 
Windows 被 设计 成 对 运行 在 操作 系统 顶部 的 应 用 程序 ， 具 有 快速 响应 时 间 。 
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2. 体系 结构 
Windows 使 用 层次 体系 结构 ， 如 图 7-21 所 示 。 


用 户 态 


和 


内 核 态 





图 7-21 Windows 的 体系 结构 


HAL 

硬件 抽象 层 (HAL) 为 上 层 隐藏 了 硬件 的 差异 。 

内 核 

内 核 是 操作 系统 的 心脏 。 它 是 面向 对 象 软件 的 一 个 片段 。 该 面向 对 象 的 软件 把 任何 实体 
都 看 成 对 象 。 

执行 者 


Windows 执行 者 为 整个 操作 系统 提供 服务 。 它 由 6 个 子 系统 构成 : 对 象 管理 器 、 安 全 
引用 监控 器 、 进 程 管理 器 、 虚 拟 内 存 管理 器 、 本 地 过 程 调用 工具 和 IO 管理 。 大 多 子 系统 是 
我 们 前 面 讨论 操作 子 系统 中 所 熟悉 的 。 有 些 子 系统 ( 像 对 象 管理 器 ) 被 加 到 Windows 中 ,是 
因为 它 的 面向 对 象 的 本 质 。 执 行者 运行 在 内 核 态 (特权 )。 

环境 子 系统 

这 些 子 系统 被 设计 用 来 允许 Windows 运行 那些 为 Windows、 其 他 操作 系统 或 Windows 
早期 版 本 设计 的 应 用 程序 。 运 行为 Windows 设计 的 应 用 的 本 地 子 系统 称 为 Win32。 环 境 子 
系统 运行 在 用 户 态 (无 特权 )。 


7.5 章 末 材料 


推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
e。 Bic, L. and Shaw, A. Operating Systems Principles, Upper Saddle River, NJ: Prentice- 


Hall, 2003 
es McHoes, A. and Flynn, I. Understanding Operating Systems, Boston, MA: Course 
Technology, 2007 
® Nutt, G. Operating Systems: A Modern Perspective, Reading, MA: Addison-Wesley, 2001 
。 Silberschatz, A. and Galvin, P Operating System Concepts, New York: Wiley, 2004 
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关键 术语 


authentication (身份 验证 ) 

batch operating system ( 批 处 理 系 统 ) 

bootstrap ( 自 举 ) 

circular waiting (循环 等 待 ) 

deadlock ( 死 锁 ) 

demand paging (请求 分 页 ) 

demand paging and segmentation (请 求 分 页 
和 分 段 ) 

demand segmentation (请 求 分 段 ) 

device manager (设备 管理 器 ) 

distributed system (分 布 式 系统 ) 

emacs 

frame ( 帧 ) 

graphical user interface (GUI， 图 形 用 户 界 面 ) 

hardware abstraction layer (HAL， 硬 件 抽 
象 层 ) 

hold state (保持 状态 ) 

job (作业 ) 

job scheduler (命令 调度 器 ) 

kernel (内 核 ) 

Linux 

memory management (内 存 管理 ) 

Microsoft Disk Operating System ( MS-DOS, 
微软 磁盘 操作 系统 ) 

monoprogramming ( 单 道 程序 ) 

multiprogramming (多 道 程序 ) 

mutual exclusion ( 互 斥 ) 

no preemption (不 可 抢占 ) 

operating system (操作 系统 ) 

page (页 ) 

paging (分 页 ) 

parallel system (并 行 系统 ) 


小 结 


partitioning (分 区 ) 

pico 

portability (可 移植 性 ) 

portability process scheduler (可 移植 性 进程 
调度 器 ) 

process (进程 ) 

process manager (进程 管理 器 ) 

program (程序 ) 

queue (队列 ) 

ready state (就 绪 状态 ) 

real-time system (实时 系统 ) 

reliability (可 靠 性 ) 

resource holding (资源 占有 ) 

running state (运行 状态 ) 

scheduler (调度 器 ) 

scheduling (调度 ) 

shell (命令 解释 器 ) 

single-user operating system (单一 用 户 操 作 
系统 ) 

software (软件 ) 

starvation ( 饥 俄 ) 

state diagram (状态 图 ) 

terminated state (终止 状态 ) 

time sharing (分 时 ) 

UNIX 

user interface (用 户 界 面 ) 

utility (工具 ) 

Vi 

virtual memory (虚拟 内 存 ) 

waiting state (等 待 状态 ) 


Windows 


。 操作 系统 是 计算 机 硬件 和 用 户 间 的 接口 。 它 方便 程序 的 执行 和 对 硬 软 件 资源 的 访问 。 
操作 系统 的 两 个 主要 设计 目标 是 硬件 的 高 效 使 用 和 资源 的 方便 使 用 。 

。 操作 系 统 经 历 了 一 个 很 长 的 演化 历史 : 批 处 理 系统 、 分 时 系统 、 单 用 户 系统 、 并 行 系 
统 和 分 布 式 系统 。 现 代 操 作 系统 至 少 有 4 个 功能 区 域 : 内 存 管 理 器 、 进 程 管理 器 、 设 
条 管理 器 、 文 件 管理 器 ， 操 作 系统 还 提供 用 户 界面 。 


扣 作 夭 统 147 


。 现代 操作 系统 的 第 一 职责 是 内 存 管理 。 内 存 分 配 必须 由 操作 系统 控制 。 内 存 管理 技术 
可 以 分 成 两 类 : 单 道 程序 和 多 道 程序 。 在 单 道 程序 中 ， 内 存 的 大 部 分 容量 都 为 一 个 程 
序 独 享 。 在 多 道 程序 中 ， 多 个 程序 同时 在 内 存 中 。 

。 现代 操作 系统 的 第 二 职责 是 进程 管理 。 进 程 是 运行 的 程序 。 进 程 管理 使 用 调度 器 和 队 
列 来 管理 进程 。 进 程 管理 涉及 具有 不 同 资源 的 不 同 进程 间 的 同步 问题 。 这 可 能 潜在 地 
造成 资源 死 锁 和 饥 钱 。 死 锁 是 指 一 个 进程 由 于 其 他 进程 无 限制 地 使 用 资源 导致 无 法 运 
行 的 情况 。 饥 饿 是 指 一 个 进程 由 于 资源 分 配 限制 太 多 而 不 能 执行 的 情况 。 

。 现代 操作 系统 的 第 三 职责 是 设备 或 IO 管理 。 : 

。 现代 操作 系统 的 第 四 职责 是 文件 管理 。 操 作 系 统 使 用 文件 管理 器 控制 对 文件 的 访问 。 
只 有 进程 或 用 户 被 允许 访问 指定 文件 时 ， 访 问 才 被 允许 。 访 问 的 类 型 可 以 改变 。 

。 具有 一 些 类 似 性 的 两 个 常见 的 操作 系统 是 UNIX 和 Linux。UNIX 是 多 用 户 、 多 进程 、 
可 移植 的 操作 系统 ， 它 由 四 部 分 构成 : 内 核 、 命 令 解 释 器 、 一 组 标准 工具 和 应 用 程 
序 。Linux 由 三 部 分 构成 : 内 核 、 系 统 工 具 和 系统 库 。 

。 微软 流行 的 操作 系统 家 族 是 Windows。Windows 是 面向 对 象 的 、 多 层 的 操作 系统 。 
它 使 用 多 层 ， 包 括 硬件 抽象 层 (HAL)、 执 行 层 和 环境 子 系统 层 。 


7.6 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相 关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练 习 前 首先 
完成 相关 测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q7-1 应 用 程序 和 操作 系统 的 不 同 点 是 什么 ? 

Q7-2 操作 系统 的 组 成 是 什么 ? 

Q7-3 单 道 程序 和 多 道 程序 之 间 有 何 区 别 ? 

Q7-4 分 页 调度 与 分 区 调度 有 什么 差别 ? 

Q7-5 为 什么 请 求 分 页 调度 比 常 规 页 面 调 度 更 有 效率 ? 

Q7-6 程序 和 作业 之 间 有 何 联系 ? 作业 和 进程 之 间 有 何 联系 ? 程序 和 进程 之 间 的 联系 又 如 何 ? 
Q7-7 程序 驻 留 在 哪里 ? 作业 驻 留 在 哪里 ?进程 驻 留 在 哪里 ? 

Q7-8 作业 调度 器 和 进程 调度 器 有 什么 区 别 ? 

Q7-9 为 什么 操作 系统 需要 队列 ? 

Q7-10 死 锁 和 饥 俄 有 何 区 别 ? 


练习 题 

P7-1 一 个 计算 机 装 有 一 个 单 道 程序 的 操作 系统 。 如 果 内 存 容量 为 64 MB ， 操 作 系统 需要 4 MB 内 存 ， 
那么 该 计算 机 执行 一 个 程序 可 用 的 最 大 内 存 为 多 少 ? 

P7-2 ”车 操作 系统 自动 分 配 10 MB 内 存 给 数据 ， 重 做 第 P7-1 题 。 

P7-3 一 个 单 道 程序 的 操作 系统 执行 程序 时 平均 访问 CPU 要 10 微 秒 ， 访 问 IO 设备 要 70 微 秒 ，CPU 
空闲 时 间 为 百 分 之 多 少 ? 

P7-4 一 个 多 道 程序 的 操作 系统 用 一 个 适当 的 分 配 计划 把 60 MB 内 存 分 为 10 MB、12 MB、18 MB、 
20 MB。 第 一 个 程序 运行 需要 17 MB 内 存 ， 使 用 了 第 三 分 区 。 第 二 个 程序 运行 需要 8 MB 内 
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P7-5 
P7-6 


P7-7 


P7-8 


P7-9 


P7-10 


存 ， 使 用 了 第 一 分 区 。 第 三 个 程序 运行 需要 10.5 MB， 使 用 了 第 二 分 区 。 最 后 ， 第 四 个 程序 运 
行 需 要 20 MB 内 存 ， 使 用 了 第 四 分 区 。 那 么 总 共 使 用 了 多 少 内 存 ? 总 共 浪 费 了 多 少 内 存 ? 内 存 
的 浪费 率 是 多 少 ? 

如 果 所 有 的 程序 都 需要 10 MB 内 存 ， 重 做 第 P7-4 题 。 

一 个 多 道 程序 的 操作 系统 使 用 分 页 调度 。 可 用 内 存 为 60 MB， 分 为 15 个 帧 ， 每 一 帧 大 小 为 
4 MB。 第 一 个 程序 需要 13 MB ， 第 二 个 程序 需要 12 MB ， 第 三 个 程序 需要 27 MB。 


a. 第 一 个 程序 需要 用 到 多 少 帧 ? b. 第 二 个 程序 需要 用 到 多 少 帧 ? 
c. 第 三 个 程序 需要 用 到 多 少 帧 ? d. 有 多 少 个 帧 没有 用 到 ? 
e. 总 共 浪 费 的 内 存 是 多 少 ? f 内 存 的 浪费 率 是 多 少 ? 


一 个 操作 系统 使 用 的 虚拟 内 存 ， 但 执行 的 时 候 需 要 所 有 的 程序 驻 留 在 物理 内 存 中 (没有 分 页 调 
度 或 分 段 调度 )。 物 理 内 存 大 小 为 100 MB ， 虚 拟 内 存 为 1 GB。 有 多 少 10 MB 大 小 的 程序 可 以 
同时 运行 ? 它们 之 中 有 多 少 可 以 随时 驻 留 在 内 存 中 ? 多 少 则 必须 要 存在 磁盘 里 ? 


进程 在 下 面 的 情况 下 处 于 什么 状态 ? 

a. 进程 在 使 用 CPU b. 进程 结束 打印 ， 等 待 CPU 再 次 调用 
c. 进程 因为 时 间 片 用 尽 而 被 终止 d. 进程 从 键盘 读 取 数 据 

e. 进程 打印 数据 


三 个 进程 (A、B 和 C) 同时 运行 ， 进 程 A 占用 Filel 但 需要 File2。 进 程 B 占用 File3 但 需要 
File1。 进 程 C 占用 File2 但 需要 File3。 为 这 几 个 进程 画 一 个 框图 。 这 种 情况 是 不 是 死 锁 ? 
三 个 进程 (A、B 和 C) 同时 运行 ， 进 程 A 占有 File1， 进 程 B 占有 File2 但 需要 Filel ， 进 程 
C 占 有 File3 但 需要 File2。 为 这 几 个 进程 画 一 个 框图 。 这 种 情况 是 不 是 死 锁 ? 如 果 不 是 ， 说 
明 进 程 怎 样 最 后 完成 它们 的 任务 。 
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本 章 首先 介绍 算法 的 概念 ， 算 法 即 分 步骤 解决 问题 的 过 程 。 然 后 讨论 那些 用 来 开发 算法 
的 工具 。 最 后 ， 列 举 一 些 常见 的 迭代 和 递归 算法 的 例子 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 定义 算法 ， 并 与 问题 求解 关联 ; 

。 定义 三 种 结构 (顺序 、 选 择 和 循环 )， 并 描述 它们 在 算法 中 的 作用 ; 

。 描述 UML 图 和 当 表 示 算 法 时 它们 是 如 何 使 用 的 ; 

。 描述 伪 代 码 和 当 表示 算法 时 它们 是 如 何 使 用 的 ; 

。 列 出 基本 算法 和 它们 的 应 用 ; 

。 描述 排序 的 概念 ， 理 解 三 种 原始 排序 算法 背后 的 机 制 ; 

。 描述 搜索 的 概念 ， 理 解 两 种 常见 搜索 算法 背后 的 机 制 ; 

。 定义 子 算法 和 它们 与 算法 的 关系 ; 

。 区 分 迭代 和 递归 算法 。 


8.1 概念 
本 节 将 给 出 算法 的 非 正 式 定义 ， 然 后 通过 一 个 例子 来 详细 讲述 算法 的 概念 。 


8.1.1 非 正式 定义 


算法 的 一 种 非 正 式 定义 如 下 : 
a EN A A ED EW FE TO TE FT LO EH DT ERO Ne A WE 
-20 入 | i 此 jo1. oF DO I re 乏 和 和 光 N 生 让 从 15 故 、， 
证 和 算法 是 一 种 逐步 解 决 问题 或 完成 任务 的 方法 。 Er NL a DS ee tt 
按照 这 种 定义 ,算法 完全 独立 于 计算 机 系统 。 更 输入 数据 


特别 的 是 ， 还 应 该 记 住 算法 接收 一 组 输入 数据 ， 同 时 
产生 一 组 输出 数据 (图 8-1 )。 


8.1.2 示例 

下 面 用 一 个 例子 来 对 这 种 简单 的 定义 进行 分 析 。 
我 们 要 生成 从 一 组 正 整数 中 找到 最 大 整数 的 一 个 算 图 8-1 计算 机 使 用 的 算法 的 非 正 式 定义 
法 。 这 个 算法 应 该 能 从 一 组 任意 整数 (5、1000、 
10 000、1 000 000 等 ) 中 找 出 其 最 大 值 。 这 个 算法 必须 具有 通用 性 并 与 整数 的 个 数 无 关 。 

很 明显 ， 要 完成 从 许多 整数 (例如 ， 100 万 个 ) 中 找到 最 大 值 的 这 个 任务 不 可 能 (由 一 
个 人 或 一 台 计 算 机 ) 只 用 一 步 完 成 。 算 法 必须 一 个 个 地 测试 每 一 个 整数 。 

要 解决 这 个 问题 ， 可 以 用 一 种 直接 的 方法 。 先 用 一 组 少量 的 整数 (例如 5 个 )， 然 后 将 
这 种 解决 方法 扩大 到 任意 多 的 整数 。 其 实 对 5 个 整数 所 采取 的 解决 方法 的 原理 和 约束 条 件 与 
对 1 000 个 或 1 000 000 个 整数 采取 的 是 一 样 的 。 可 以 假设 ， 即 使 是 $ 个 整数 的 例子 ， 算 法 





输出 数据 
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也 必须 一 个 接 一 个 地 处 理 那 些 整数 。 看 到 第 一 个 整数 ， 并 不 知道 一 下 的 整数 的 值 。 等 处 理 完 第 


一 个 整数 ， 算 法 才 开始 处 理 第 二 个 整数 ， 依 次 进行 。 图 8-2 展示 了 解决 这 个 问题 的 一 种 方法 。 
(12 8 13 9 11) 输入 数据 


最 大 值 8 T103T9， Ti 列表 


步骤] 


最 大 值 | 12 13 | 9 | 11 | 列表 


步骤 2 


最 大 值 12|s8 本 KW 9 | 1 | 列表 


步骤 3 


最 大 什 1I2 | 8 | 13 JE 11 | 列表 
步 又 4 


最 大 值 12| 8 113 | 9 局] 于 1 未 
步骤 5 





FindLargest 
(13 ) 输出 数据 
图 8-2 找到 5 个 整数 之 中 的 最 大 值 


我 们 称 这 个 算法 为 求 最 大 值 算法 ( FindLargest)。 每 个 算法 都 有 自己 不 同 于 其 他 算法 的 
名 字 。 这 个 算法 接收 一 组 5 个 整数 作为 输入 ， 然 后 输出 其 中 的 最 大 值 。 

1. 输入 

这 个 算法 需要 输入 一 组 5 个 整数 。 

2. 过 程 

在 这 个 算法 中 为 求 最 大 值 采取 了 下 面 5 个 步骤 ; 


第 1 步 
在 这 一 步 中 ， 算 法 首先 检查 第 一 个 整数 ( 12 )。 因 为 还 没有 检查 其 他 的 整数 (第 一 步 只 


检查 了 第 一 个 整数 ， 其 他 的 会 在 以 后 检查 )， 所 以 当前 的 最 大 值 (到 目前 为 止 ) 就 是 第 一 个 整 
数 。 算 法 中 定义 了 一 个 称 为 Largest 的 变量 ， 并 把 第 一 个 整数 ( 12 ) 赋 给 了 它 。 

第 2 步 

目前 的 最 大 整数 是 12， 但 新 的 数字 可 能 会 成 为 新 的 Largest。 算 法 把 上 一 步 得 到 的 
Largest( 即 12 ) 和 第 二 个 整数 (8 ) 比较 。 发 现 目前 的 Largest 大 于 第 二 个 整数 ， 也 就 是 说 ， 
Largest 还 是 最 大 值 ， 不 需要 改变 。 

第 3 步 

目前 的 最 大 整数 还 是 12， 但 是 新 的 整数 ( 13 ) 大 于 Largest。 这 就 意味 着 目前 Largest 的 
值 是 无 效 的 ， 而 应 该 由 第 三 个 整数 ( 13 ) 代替 。 算 法 把 13 赋 给 Largest， 然 后 进入 下 一 步 。 

第 4 步 

该 步 中 最 大 整数 并 没有 改变 ， 因 为 当前 Largest 比 第 四 个 整数 (9 ) 大 。 

第 5 步 

该 步 中 最 大 整数 并 没有 改变 ， 因 为 当前 Largest 比 第 五 个 整数 (11 ) 大 。 

3. 输出 

因为 已 经 没有 其 他 数 需 要 处 理 ， 所 以 算法 输出 的 Largest 值 是 13。 
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8.1.3 定义 动作 
图 8-2 并 没有 说 明 每 一 步 究 竟 做 了 什么 工作 。 可 以 改变 测试 数据 了 解 更 多 的 细节 。 例 
如 ， 第 1 步 ， 把 Largest 设 为 第 一 个 整数 的 值 。 第 2 步 到 第 5 步 ， 依 次 把 当前 处 理 的 整数 与 
Largest 的 值 进行 比较 。 如 果 当 前 整数 大 于 Largest， 则 把 它 赋 给 Largest (图 8-3 )。 
(12 8 13 9 11) 输入 数据 


果 第 2 个 整数 ; 数 大 于 Latgest; 册 则 Pe ALargests - 


rt yt 


1 果 第 2 : Tarr ri 


下 Jr < 二 - CE 区 人 ho 机 | > Pa A aj eri = 
-1 I J se LS 二 TY Eo Er . 一 | 
如 1 4 mA -Larpgest, 则 把 起 屋 给 [arg Ne AT EAP 和光 
2 人 I A 1 4 > ~ ak p = Fr- > ” 

全 人 三 Reeta dt Pep ee sr 人 了 人 4 [| 


Pay 2 J of 2 hx A 于 
ti | 把 它 赋 给 eit ti ee | 9 
P pe > 


ST 
it 





(13 ) 输出 数据 
图 8-3 ”定义 FindLargest 算法 中 的 动作 


8.1.4 细 化 


为 了 使 算法 能 在 所 有 的 程序 中 应 用 ， 还 需要 进行 细 化 。 现 在 有 两 个 问题 ， 首 先 ， 第 1 步 
中 的 动作 与 其 他 步骤 中 不 一 样 。 其 次 ， 第 2 步 到 第 5 步 中 的 程序 描述 语言 不 同 。 我 们 只 要 很 
简单 地 改进 一 下 算法 就 可 解决 以 上 两 个 问题 。 把 第 2 步 到 第 5 步 的 程序 段 都 写成 “如 果 当 前 整 
数 大 于 Largest， 那 么 当前 整数 就 成 为 Largest”。 第 一 步 不 同 于 其 他 步 是 因为 那 时 Largest 还 没 
有 初始 化 。 如 果 开 始 就 把 Largest 初始 化 成 ~- ( 负 无 穷 )， 那 么 第 一 步 就 可 写成 和 其 他 步 一 样 ， 
所 以 ， 增 加 一 个 新 的 步骤 ， 可 称 为 第 0 步 ， 也 就 是 表明 它 要 在 处 理 任何 其 他 整数 之 前 完成 。 

图 8-4 显示 了 改进 后 的 程序 步骤。 因为 步骤 都 是 一 样 的 ， 所 以 做 了 省 略 。 

(12 8 13 9 11) 输入 数据 


Te 和 RS 


Ps 


i 到 本 3 et A 出 把 它 屿 给 [ 且 weSi ER UD i A 
-如 直 当前 可 SN cold AR 汪 二 ‘Sy se Hl 





(13 ) 输出 数据 
图 8-4” 细 化 的 FindLargest 算法 
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8.1.5 泛 化 

可 以 把 这 个 算法 泛 化 吗 ? 假使 要 从 7 个 正 整数 中 找到 最 大 值 ，= 的 值 可 能 是 1 000 或 
1 000 000， 或 者 更 多 。 当 然 ， 可 以 按照 图 8-4 所 示 重 复 每 一 步 。 但 是 如 果 将 算法 改变 成 程 
序 ， 就 必须 编写 n 步 操作 ! 

有 一 种 更 好 的 方法 可 以 改进 它 。 只 要 让 计算 机 循环 这 个 步骤 nn 次。 现在 我 们 已 经 在 算法 
图 形 表示 (图 8-5 ) 中 包括 了 这 个 特性 。 


输入 数据 (m 个 整数 ) 


一 有 


2 Ee re TUERTTRTOS py Te ENR 一: 各 忒 二 
A .7 和 全 和 er ey ME ITS 六 于 人 Ar 4+ 
hry 4 3 a mn | Uvadd Tm a 
,| nn 门 全 下 证 了 和 了 和 4 A 本 A es 日 A eA we ne < 
个 到 ~ - > 2 We S ~ I A f= 

, “eh re a ir a ee NM A 村庄 a 





输出 数据 
图 8-5 求 最 大 值 算法 的 泛 化 


8.2 三 种 结构 

计算 机 专家 为 结构 化 程序 或 算法 定义 了 三 种 结构 。 这 种 想法 认为 程序 必定 是 由 顺序 、 判 
断 (选择 ) 和 循环 (图 8-6 ) 这 三 种 结构 组 成 的 。 已 经 证 实 其 他 结构 都 是 不 必要 的 。 仅 仅 使 
用 这 三 种 结构 就 可 以 使 程序 或 算法 容易 理解 、 调 试 或 修改 。 





b) 判 断 
图 8-6 三 种 结构 


8.2.1 顺序 
第 一 个 结构 称 为 顺序 结构 。 算 法 (最 终 是 程序 ) 都 是 指令 序列 。 它 可 以 是 一 个 简单 指令 
或 是 其 他 两 种 结构 之 一 。 


8.2.2 判断 


有 些 问 题 只 用 简单 的 指令 序列 是 不 能 够 解决 的 。 有 时 候 需 要 检测 一 个 条 件 是 否 满足 。 假 
如 测试 的 结果 为 真 ， 则 可 以 继续 顺序 往 下 执行 指令 ; 假如 结果 为 假 ， 程 序 将 从 另外 一 个 顺序 
结构 的 指令 继续 执行 。 这 就 是 所 谓 的 判断 (选择 ) 结构 。 


8.2.3 ”循环 
在 有 些 问 题 中 ， 相 同 的 指令 序列 需要 重复 。 可 以 用 重复 或 循环 结构 来 解决 这 个 问题 。 从 
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指定 的 整数 集中 求 最 大 整数 的 算法 就 是 这 种 结构 。 


8.3 算法 的 表示 
到 目前 为 止 ， 我 们 已 经 使 用 图 来 表示 算法 的 基本 概念 。 在 最 近 几 十 年 中 ， 还 出 现 了 其 他 
几 种 用 来 表示 算法 的 工具 。 这 里 将 介绍 UML 和 伪 代 码 这 两 种 工具 。 


8.3.1 UML 
统一 建 模 语言 ( UML ) 是 算法 的 图 形 表示 法 。 它 使 用 “大 图 ”的 形式 掩盖 了 算法 的 所 有 


细节 ， 只 显示 算法 从 开始 到 结束 的 整个 流程 。 
在 附录 B 中 有 UML 的 具体 说 明 。 这 里 只 给 出 三 种 结构 的 UML 表示 (图 8-7 )。 注 意 ， 
UML 很 灵活 ， 正 如 附录 B 中 所 展示 的 那样 。 如 果 在 假 的 部 分 没有 操作 ， 那 么 判断 结构 就 能 


简化 。 


< 


a) 顺 序 b) 判 断 c) 循 环 
图 8-7 三 种 结构 的 UML 





8.3.2 伪 代 码 


伪 代 码 是 算法 的 一 种 类 似 英语 的 表示 法 。 现 在 还 没有 伪 代 码 的 标准 。 有 些 人 使 用 得 过 
细 ， 有 些 人 则 使 用 得 过 粗 。 有 些 人 用 一 种 很 像 英 语 的 代码 ， 有 些 人 则 用 和 Pascal 编程 语言 相 
似 的 语法 。 在 附录 C 中 有 伪 代 码 的 具体 说 明 。 这 里 只 演示 伪 代 码 是 如 何 表示 三 种 结构 的 (如 


图 8-8 所 示 )。 


r (condition) 


truveAction(s) 


} 
a while (condition) 
{ 
falseAction(s) Action(s) 
} 


a) 顺 序 b) 判 断 c) 循 环 
图 8-8 用 伪 代 码 表示 三 种 结构 


action ] 
action 2 





actionn 
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用 伪 代 码 写 出 求 两 个 整数 之 和 的 算法 。 
解 ”这 个 简单 的 问题 只 要 用 顺序 结构 就 可 以 解决 。 注 意 ， 同 时 还 给 该 算法 命名 ， 定 义 算 


法 的 输入 ， 并 在 结尾 用 一 条 返回 指令 来 返回 和 (算法 8.1 )。 
算法 8.1 计算 两 个 整数 之 和 


算法 : SumOfTwo (first，second) 
目的 : 求 两 整数 之 和 
前 提 : 给 定 两 个 整数 (first 和 second) 


: 无 
返回 : 和 的 值 


sum 4 一 first + second 
return sum 


编写 可 以 把 一 组 不 同 的 成 绩 分 成 及 格 或 不 及 格 的 算法 。 

解 ” 这 个 问题 如 果 仅 用 顺序 结构 将 无 法 完成 ， 另 外 还 需要 判断 结构 。 计 算 机 给 出 
0 一 100 之 间 的 一 个 数 ， 如 果 这 个 数 大 于 或 等 于 70 则 返回 “及 格 ”( pass)， 如 果 小 于 70 则 返 
回 “ 不 及 格 ”(nopass)。 算 法 8.2 给 出 了 该 算法 的 伪 代 码 表 示 。 


算法 8.2 及 格 /不 及 格 分 级 


算法 ， Pass/NoPass (score) 
目的 : 给 定 分 数 ， 创建 及 格 / 不 及 格 等 级 
前 提 : 给 定 要 被 改 成 等 级 的 分 数 


: 无 
返回 : 等 级 


if (score 70) 
Grade 人 一 "pass" 
else 
Grade + "nopass" 
return grade 


} 


编写 将 数字 型 成 绩 (整数 ) 变 为 字母 等 级 成 绩 的 算法 。 
解 ” 这 个 问题 需要 多 个 判断 。 算 法 8.3 中 的 伪 代 码 显示 的 是 一 种 解决 方法 (并 不 是 最 好 


的 方法 ,但 却 是 最 容易 理解 的 方法 )。 同 样 ， 计 算 机 给 出 0 一 100 之 间 的 一 个 任意 数 ， 算 法 必 
须 把 它 划 分 到 正确 的 字母 等 级 中 去 (A、B、C、D 或 F)。 
算法 8.3 ”赋予 字母 等 级 成 绩 


算法 : LetterGrade (score) 
目的 : 给 定 分 数 ， 找 到 相应 字母 等 级 
前 提 :; 给 定数 字 分 数 

无 


返回 ， 字 母 等 级 


if (100 > Score 2 90) 
grade 4 一 'A' 

if (89 2 score'2 80) 
Grade  'B' 

if (79 > score 2 70) 
grade — "TC 

if (69 > Score 2 60) 
grade *— “人 
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if (59 之 'score 之 '0) | 
grade 一 'F' 
return grade 


) 

二 这 里 让 语句 不 需要 else 语句 ， 因为 如 果 条 件 不 成 立 并 不 需要 做 什么 。 
编写 从 一 组 整数 中 求 最 大 数 的 算法 ， 该 组 整数 的 数目 事先 并 不 知道 。 
使 用 图 8-5 中 介绍 的 概念 :编写 出 解决 该 问题 的 算法 ( 见 算法 8.4 )。 


算法 8.4 ” 求 一 组 整数 中 的 最 大 数 





算法 : FindLargest (1ist) 
目的 : 求 一 组 整数 中 的 最 大 值 
前 提 : 给 定 一 组 整数 

无 


返回 : 最 大 整数 


largest + 一 22 
while (more integers to check) 


{ 


current ~ next integer 
if (current > largest) 
nn et 


} 
return largest 


) 


写 从 一 组 整数 前 1 000 个 整数 中 求 最 小 值 的 算法 。 
解 这 里 需要 用 一 个 计数 器 来 计数 。 把 这 个 计数 器 初始 化 为 1， 每 循环 一 次 就 对 它 加 1。 


当 计 数 器 大 于 1 000 时 ， 退 出 循环 (参见 算法 8.5 )。 注 意 ， 列 表 中 有 超过 1 000 个 整数 ， 但 
我 们 需要 求 前 1 000 个 整数 中 的 最 小 值 。 
算法 8.5 ” 求 前 1 000 个 整数 中 的 最 小 整数 


算法 Findsmallest (1ist) 
目的 : 求 前 1000 个 整数 中 的 最 小 整数 ， 并 返回 
前 提 : 给 定 一 组 超过 1000 个 整数 的 数 


; 无 
返回 ; 最 小 整数 
Smal1lesSt *—+o 
Counter 一] 


while (counter<1000) 
{ 


current + 一 next integer 

if(current<smallest) 
smallest + 一 current 

counter t+ 一 CouUnteLr+1 


} 


return smallest 


| 


8.4 ”更 正式 的 定义 
。 el 


有 限 的 时 间 内 终止 。 
3 限 Tt 9 a Evy 次 
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下 面 详细 解释 一 下 这 个 定义 。 


8.4.1 定义 良好 
算法 必须 是 一 组 定义 良好 且 有 序 的 指令 集合 。 
8.4.2 ”明确 步骤 


算法 的 每 一 步 都 必须 有 清晰 、 明 白 的 定义 。 如 果 某 一 步 是 将 两 个 整数 相 加 ， 那 么 必须 定义 相 
加 的 两 个 整数 和 加 法 符号 ， 相 同 的 符号 不 能 在 某 处 用 作 加 法 符号 ， 而 在 其 他 地 方 用 作 乘 法 符号 。 


8.4.3 产生 结果 
算法 必须 产生 结果 ， 否 则 该 算法 就 没有 意义 。 结 果 可 以 是 返回 给 调用 算法 的 数据 或 其 他 
效果 (如 打印 )。 


8.4.4 在 有 限 的 时 间 内 终止 


算法 必须 能 够 终止 (停机 )。 如 果 不 能 (例如 ， 无 限 循环 )， 说 明 不 是 算法 。 第 17 章 将 
讨论 可 解 问题 与 不 可 解 问题 。 你 将 会 看 到 ， 可 解 问题 的 解法 形式 为 一 个 可 终止 的 算法 。 


8.5 基本 算法 

有 一 些 算法 在 计算 机 科学 中 应 用 非常 普遍 ， 我 们 称 之 为 “基本 ”算法 。 这 里 将 讨论 一 些 
最 常用 的 算法 。 讨 论 只 是 概括 性 的 ， 具 体 的 实现 则 取决 于 采用 何 种 语言 。 
8.5.1 求 和 


计算 机 科学 中 经 常用 到 的 一 种 算法 是 求 和 。 你 可 以 容易 地 实现 两 个 或 三 个 整数 的 相 加 ， 
但 是 怎样 才能 实现 一 系列 整数 相 加 呢 ? 答案 很 简单 :在 循环 中 使 用 加 法 操作 ( 见 图 8-9 ) 。 


上 





图 8-9 求 和 算法 
求 和 算法 可 分 为 三 个 逻辑 部 分 ; 


类 六 





1 ) 将 和 (sum) 初始 化 。 
2 ) 循环 ， 在 每 次 迭代 中 将 一 个 新 数 加 到 和 (sum) 上 。 
3 ) 退出 循环 后 返回 结果 。 


8.5.2 乘积 | 
另 一 个 常用 算法 是 求 出 一 系列 整数 的 乘积 。 方 法 也 很 简单 ， 在 循环 中 使 用 乘法 操作 ( 见 
图 8-10 )。 乘 法 算法 有 三 个 逻辑 部 分 : 
1 ) 将 乘积 (product) 初始 化 。 
2 ) 循环 ， 在 每 次 欠 代 中 将 一 个 新 数 与 乘积 (product) 相 乘 。 
3 ) 退出 循环 后 返回 结果 。 





图 8-10 ”乘积 算法 


例如 ， 上 面 的 算法 通过 较 小 的 改动 可 以 用 来 计算 w( 留 作 练 习 )。 男 一 个 例子 ， 即 采用 
同样 的 算法 可 以 实现 整数 的 阶乘 运算 。 这 个 将 在 本 章 后 面 介 绍 。 


8.5.3 最 大 和 最 小 


本 章 开头 讨论 了 求 一 组 整数 中 最 大 值 的 算法 。 它 的 思想 是 通过 一 个 判断 结构 求 出 两 个 数 
中 的 较 大 值 。 如 果 把 这 个 结构 放 在 循环 中 ， 就 可 以 求 出 一 组 数 中 的 最 大 值 。 

求 一 组 整数 中 的 最 小 值 和 上 面 的 方法 相似 ， 只 有 两 个 小 小 的 不 同 。 首 先 ， 用 判断 结构 求 出 
两 个 整数 中 的 较 小 值 。 其 次 ， 在 初始 化 时 使 用 一 个 很 大 的 而 不 是 非常 小 的 整数 。 图 8-11 展示 了 
从 整数 列表 中 找到 最 小 值 的 算法 。 从 整数 列表 中 找到 最 大 值 的 算法 的 图 与 其 类 似 ， 留 作 练 习 。 


8.5.4 排序 


计算 机 科学 中 的 一 个 最 普遍 应 用 是 排序 ， 即 根据 数据 的 值 对 它们 进行 排列 。 人 们 的 周 
围 充满 了 数据 ， 如 果 这 些 数据 都 是 无 序 的 ， 可 能 会 花 很 多 时 间 去 查找 一 条 简单 信息 。 想 象 一 
下 ， 在 一 个 没有 排序 的 电话 本 中 查找 某 人 的 电话 号 码 是 多 么 困难 的 一 件 事 。 

本 节 将 介绍 三 种 排序 算法 : 选择 排序 、 冒 泡 排序 、 插 入 排序 。 这 三 种 方法 是 当今 计算 机 


1 ， 关 2 二 


科学 中 使 用 的 快速 排序 的 基础 。 


条 件 : :0 
还 有 需要 处 理 的 整数 


Dh 


icurrent < smallest 


和 a 
EE EE ss dd 





图 8-11 找到 最 小 的 数据 项 


1. 选择 排序 

在 选择 排序 中 ， 数 字 列 表 可 分 为 两 个 子 列表 (已 排序 的 和 未 排序 的 )， 它 们 通过 假想 的 
一 堵 墙 分 开 。 求 未 排序 子 列表 中 最 小 的 元 素 并 把 它 和 未 排序 子 列表 中 的 第 一 个 元 素 进 行 交 
换 ， 经 过 每 次 选择 和 交换 ， 两 个 子 列表 中 假想 的 这 堵 墙 向 前 移动 一 个 元 素 ， 这 样 每 次 排序 列 
表 中 将 增加 一 个 元 素 而 未 排序 列表 中 将 减少 一 个 元 素 ， 每 次 把 一 个 元 素 从 未 排序 列表 移 到 已 
排序 列表 就 完成 了 一 轮 排序 。 一 个 含有 7 个 元 素 的 数字 列表 需要 n-1 轮 排序 来 完成 数据 的 重 
新 排列 。 选 择 排序 的 流程 图 如 图 8-12 所 示 。 


增 用 第 :到 第 sn 个 数字 之 间作 
的 最 小 值 和 第 k 个 数字 交换 
已 排序 未 排序 


图 8-12 ”选择 排序 


图 8-13 给 出 了 对 6 个 整数 进行 排序 的 步骤 。 该 图 显示 出 了 在 排序 列表 和 未 排序 列表 之 
间 的 那 墙 墙 在 每 轮 中 是 如 何 移动 的 。 仔 细 体 会 该 图 ， 就 可 以 看 到 经 过 5 轮 后 完成 对 列表 的 排 
序 ， 轮 数 比 该 列表 中 元 素 的 个 数 少 1。 因 此 ， 如 果 使 用 循环 控制 排序 ， 那么 循环 的 次 数 是 列 
表 中 的 元 素 个 数 减 1。 

选择 排序 算法 

该 算法 使 用 两 重 循环 ， 外 层 循 环 每 次 扫描 时 迭代 一 次 ， 内 层 循环 在 未 排序 列表 中 求 最 小 
的 元 素 。 图 8-14 给 出 了 选择 排序 算法 的 UML 图 ， 内 层 循环 在 图 中 并 没有 明显 地 显示 出 来 ， 
但 循环 中 的 第 一 条 指令 本 身 就 是 一 个 循环 。 我 们 把 循环 的 演示 留 给 读者 作为 练习 。 
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原始 列表 
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图 8-13 ”选择 排序 示例 


PR ， 整 数列 表 ~ 






Ts 


让 


条 件 : 
还 要 执行 更 多 轮 


PT 





找到 未 排序 
列表 中 的 最 小 元 素 


这 涉及 另 一 个 循环 













将 最 小 的 元 素 和 未 排序 子 列 
表 中 的 第 一 个 元 素 进 行 交换 








将 墙 向 右 移动 一 个 元 素 


返回 ; 排 好 序 的 列表 


图 8-14 选择 排序 算法 


2. 冒 泡 排序 
在 冒 泡 排序 方法 中 ， 数 字 列 表 被 分 为 两 个 子 列表 : 已 排序 的 和 未 排序 的 。 在 未 排序 子 列 


表 中 ， 最 小 的 元 素 通 过 冒 泡 的 方法 选 出 来 并 移 到 已 排序 子 列表 中 。 当 把 最 小 的 元 素 移 到 已 排 
序列 表 后 ， 墙 向 前 移动 一 个 元 素 ， 使 得 已 排序 元 素 的 个 数 增加 1， 而 未 排序 元 素 的 个 数 减少 
1。 每 次 元 素 从 未 排序 子 列表 中 移 到 已 排序 子 列表 中 ， 便 完成 一 轮 ( 见 图 8-15 )。 一 个 含有 7 
个 元 素 的 列表 ， 冒 泡 排序 需要 n-1 轮 来 完成 数据 排序 。 

图 8-16 给 出 了 每 一 轮 后 墙 移动 一 个 元 素 的 过 程 。 第 一 轮 ， 从 56 开始 并 把 它 与 32 比较 ， 
因为 它 不 小 于 32 所 以 墙 没 有 移动 。 继 续 下 一 个 元 素 ， 都 未 发 生变 化 直到 45 和 8 进行 比较 ， 
由 于 8 比 45 小 ， 这 两 个 元 素 进 行 位 置 交 换 。 继 续 下 一 个 元 素 ， 因 为 8 向 后 移动 一 个 元 素 ， 
所 以 它 现在 和 78 比较 ， 显 然 这 两 个 元 素 需 交换 位 置 。 最 后 ，8 和 23 比较 并 交换 位 置 。 经 过 
一 系列 交换 ，8 被 放置 在 第 一 个 位 置 ， 并且 墙 向 前 移动 了 1 个 位 置 。 这 个 算法 就 是 因 其 中 数 
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字 (这 个 例子 中 的 8 ) 向 列表 的 开始 或 顶部 移动 的 方式 就 像 水 泡 从 水 中 冒 出 的 样子 而 得 名 。 
增 冒 泡 

YYYY YYYY YN 
_ 


n 





未 排序 


图 8-15 冒 泡 排序 


注意 ， 在 墙 到 达 列 表 末尾 之 前 ， 我 们 已 经 停止 了 了， 因为 列表 已 经 是 有 序 的 。 我 们 总 是 
能 在 算法 中 包含 一 个 指示 器 ， 如 果 在 一 轮 中 没有 数据 交换 ， 那 就 停止 按 轮 排序 。 通 过 减少 步 
数 ， 这 个 事实 能 用 来 改善 冒 泡 排序 的 性 能 。 
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排 好 序 
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图 8-16 冒 泡 排 序 示例 


冒 泡 排 序 在 最 初 被 编写 为 将 列表 中 的 最 大 元 素 “ 向 下 冒 泡 ”。 从 效率 的 观点 来 看 ， 无 论 
是 大 数 冒 泡 还 是 小 数 冒 泡 并 没有 什么 区 别 。 然 而 ， 从 连贯 性 的 观点 来 看 ， 采 用 同一 工作 方式 
将 使 得 在 三 种 排序 方法 之 间 比 较 较 为 容易 。 因 此 我 们 选择 每 轮 对 最 小 值 进行 冒 泡 。 

冒 泡 排序 算法 | 

冒 泡 排序 也 使 用 两 重 循环 ， 外 层 循 环 每 轮 迭代 一 次 ; 内 层 循环 的 每 次 迭代 则 将 某 一 元 素 
冒 泡 至 顶部 ( 左 部 )。 我 们 把 UML 图 和 伪 代 码 留 给 读者 作为 练习 。 

3. 插 人 排序 

插入 排序 是 最 常用 的 排序 技术 之 一 ， 经 常 在 扑克 有 牌 游戏 中 使 用 。 玩 家 将 拿 到 的 每 张 牌 插 
人 手中 合适 的 位 置 ， 以 便 手 中 的 牌 以 一 定 的 顺序 排列 。( 扑 克 牌 排序 是 一 种 使 用 两 个 标准 进 
行 排序 的 例子 : 匹配 和 等 级 。) 

在 插入 排序 中 ， 和 本 章 中 讨论 的 其 他 两 种 排序 方法 一 样 ， 排 序列 表 被 分 为 两 部 分 : 已 排 
序 的 和 未 排序 的 。 在 每 轮 ， 把 未 排序 子 列表 中 的 第 一 个 元 素 转 移 到 已 排序 子 列表 中 ， 并 且 插 
人 合适 的 位 置 ( 见 图 8-17 )。 可 以 看 到 ， 一 个 含有 个 元 素 的 列表 至 少 需 要 n-1 轮 排序 。 


-“ 在 已 排序 部 分 的 合适 位 置 } 
插入 未 排序 部 分 的 第 1 个 元 素 








图 8-17 插入 排序 
图 8-18 演示 了 对 列表 中 的 6 个 数 进行 插入 排序 的 过 程 。 每 轮 中 ， 当 从 未 排序 子 列表 中 


删除 一 个 元 素 并 插 人 已 排序 子 列表 中 时 墙 便 移动 一 个 元 素 。 
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图 8-18 插入 排序 示例 


插入 排序 算法 

插入 排序 算法 的 设计 类 似 于 选择 排序 算法 和 冒 泡 排序 算法 的 模式 。 外 层 循 环 每 轮 都 迭 
代 ， 内 层 循环 则 寻找 插入 的 位 置 。 我 们 将 UML 图 和 伪 代 码 留 给 读者 作为 练习 。 

4. 其 他 排序 算法 

这 里 讨论 的 三 种 排序 算法 是 效率 最 低 的 排序 算法 ， 如 果 要 排序 的 列表 中 有 多 于 几 百 个 元 
素 ， 那 么 不 应 该 使 用 这 些 算 法 。 在 这 里 讨论 这 些 算 法 只 是 出 于 学 习 的 目的 ， 但 它们 不 实用 。 
在 一 本 导论 书 中 讨论 这 些 排 序 算法 有 几 个 原因 

。 它们 是 最 简单 的 算法 ， 容 易 理解 和 分 析 。 

。 它们 是 更 高 效 算法 的 基础 ， 如 快速 排序 、 堆 排序 、Shell 排序 、 桶 排序 、 合 并 排序 和 

基 排 序 等 。 

大 多 数 这 些 高 级 排序 算法 在 关于 数据 结构 的 图 书 中 有 讨论 。 

为 什么 会 有 这 么 多 的 排序 算法 ? 原因 就 在 于 需要 排序 的 数据 的 类 型 。 一 种 算法 对 部 分 排 
序 的 数据 很 有 效 ， 而 另 一 种 算法 对 完全 未 排序 的 数据 很 有 效 。 为 了 决定 哪 种 算法 更 适合 特定 
的 程序 ， 需 要 一 种 叫 作 算法 复杂 度 的 度量 。 第 17 章 将 讨论 这 个 问题 ,但 是 彻底 理解 则 需要 
学 习 程序 设计 和 数据 结构 方面 的 额外 课程 。 


8.5.5 查找 


在 计算 机 科学 里 还 有 一 种 常用 的 算法 叫 作 查 找 ， 是 一 种 在 列表 中 确定 目标 所 在 位 置 的 算 
法 。 在 列表 中 ,查找 意味 着 给 定 一 个 值 ， 并 在 包含 该 值 的 列表 中 找到 第 一 个 元 素 的 位 置 。 对 
于 列表 有 两 种 基本 的 查找 方法 : 顺序 查找 和 折 半 查找 。 顺 序 查找 可 以 在 任何 列表 中 查找 ， 折 
半 查 找 则 要 求 列 表 是 有 序 的 。 


1. 顺序 查找 
顺序 查找 用 于 在 无 序列 表 中 查找 。 一 般 来 说 ， 可 以 用 这 种 方法 来 查找 较 小 的 列表 或 不 常 


用 的 列表 。 其 他 情况 下 ， 最 好 的 方法 是 首先 将 列表 排序 ， 然 后 使 用 后 面 将 要 介绍 的 折 半 查找 
进行 查找 。 

顺序 查找 是 从 列表 起 始 处 开始 查找 ， 当 找到 目标 元 素 或 确信 查找 目标 不 在 列表 中 时 ， 查 
找 过 程 结束 。 图 8-19 演示 了 查找 数值 62 的 步 又。 查找 算法 需要 被 设计 成 : 当 找到 目标 或 到 


达 列 表 未 尾 时 算法 就 停止 。 





1 2 3 4 5 6 7 8 9 10 1 1 
4|213| 1 村: 汪 ?|s|2| 7 as 7 


图 8-19 ”顺序 查找 示例 





2. 折 半 查找 
顺序 查找 算法 是 很 慢 的 。 如 果 列 表 里 有 100 万 个 元 素 ， 在 最 坏 的 情况 下 需要 进行 100 万 


次 比较 。 如 果 这 个 列表 是 无 序 的 ， 则 顺序 查找 是 唯一 的 方法 。 如 果 这 个 列表 是 有 序 的， 那么 
就 可 以 使 用 一 个 更 有 效率 的 方法 ， 称 为 折 半 查找 。 一 般 来 说 ， 程 序 员 在 列表 很 大 时 使 用 折 半 
查找 。 

折 半 查找 是 从 一 个 列表 的 中 间 元 素来 测试 的 ， 这 将 能 够 判别 出 目标 在 列表 的 前 半 部 分 还 
是 后 半 部 分 。 如 果 在 前 半 部 分 ， 就 不 需要 查找 后 半 部 分 。 如 果 在 后 半 部 分 ， 就 不 需要 查找 前 
半 部 分 。 换 名 话说， 可 以 通过 判断 减少 一 半 的 列表 。 

重复 这 个 过 程 直到 找到 目标 或 者 确定 目标 不 在 这 个 列表 里 。 图 8-20 给 出 了 如 何在 12 个 
数字 的 列表 中 找到 目标 22， 其 中 使 用 了 三 个 引用 : first、mid、last。 

1 ) 开始 时 ，first 为 1，last 为 12。 使 mid 在 中 间 位 置 ，( 1+12 ) /2 或 6。 现在 比较 目标 
(22 ) 与 在 位 置 6 的 数 (21 )。 目 标 比 它 大 ， 所 以 忽略 前 半 部 分 。 

2) 将 first 移 动 到 mid 的 后 面 ， 即 位 置 7。 使 mid 在 第 二 个 一 半 的 中 间 ，(7+12 ) /2 
或 9。 现 在 比较 目标 (22 ) 与 位 置 9 的 数 (62)。 目 标 比 它 小 ， 所 以 忽略 (62) 以 后 
的 数 。 

3 ) 将 last 移动 到 mid 的 前 面 ， 即 位 置 8。 重 新 计算 mid 为 (8+7 ) /2 或 7。 比 较 目 标 
(22 ) 与 位 置 7 的 数 (22 )。 由 于 找到 了 目标 ， 此 时 算法 结束 。 

折 半 查找 算法 需要 设计 成 : 找到 元 素 或 者 目标 不 在 列表 中 算法 停止 。 从 这 个 算法 也 能 看 
出 : 当 目 标 不 在 列表 中 时 ，last 的 值 就 变 成 小 于 first 的 值 ， 这 不 正常 的 条 件 让 我 们 知道 什么 
时 候 退 出 循环 。 
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给 定 目标 (22 ) : 确定 位 置 (7 ) 








ae 
， | 
first -1 二 4 5 0 7 a 9 ”J 
EE : EEEDENEDNEN 
2 忆 现 归 : 0 car RO ; 
last : 
62 > target NN--.. 
22 = target ON- 
8.6 子 算法 


根据 在 8.2 节 描述 过 的 三 种 编程 结构 ， 可 以 为 每 一 个 可 解 的 问题 创建 算法 。 结 构 化 编程 
的 原则 要 求 将 算法 分 成 几 个 单元 ， 称 为 子 算法 。 每 个 子 算法 依次 又 分 为 更 小 的 子 算法 。 一 
个 好 的 例子 是 图 8-14 中 的 选择 排序 算法 。 在 未 排序 的 子 列表 中 求 最 小 的 整数 是 一 个 独立 的 
任务 ， 它 能 被 看 成 一 个 子 算法 (图 8-21 )。 在 每 次 迭代 中 ， 算 法 SelectionSort 调用 子 算法 
FindSmallest。 

使 用 子 算法 至 少 有 两 个 优点 : : 

。 程序 更 容易 理解 。 仔 细 查 看 SelectionSort 算法 ， 很 快 便 可 以 发 现任 务 (在 未 排序 列表 

中 求 最 小 的 整数 ) 重复 执行 了 。 

。 子 算法 可 在 主 算法 中 的 不 同 地 方 调用 ， 而 无 须 重 写 。 


8.6.1 结构 图 


程序 员 使 用 的 另 一 个 编程 工具 就 是 结构 图 。 结 构图 是 一 种 高 级 设计 工具 ， 它 显示 了 算法 
和 和子 算法 之 间 的 关系 。 它 一 般 在 设计 阶段 使 用 ， 而 不 是 在 编程 阶段 。 附 录 D 将 简要 讨论 结 
构图 。 
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调用 FindSmallest 算 法 ， 
扫描 未 排 


FindSmallest 算 法 





SelectionSort 算 法 


图 8-21 子 算法 的 概念 


8.7 ”递归 
通常 ， 有 两 种 途径 可 用 于 编写 解决 问题 的 算法 。 一 种 使 用 和 迭代 ， 另 一 种 使 用 递归 。 递 归 
是 算法 自我 调用 的 过 程 。 


8.7.1 ” 壕 代 的 定义 
学 习 一 个 简单 的 例子 ， 考 虑 一 个 阶乘 的 计算 。 阶 乘 的 因子 是 从 1 到 该 数 的 整数 。 和 迭代 的 
定义 如 图 8-22 所 示 。 如 果 算 法 的 定义 不 涉及 算法 本 身 ， 则 算法 是 迭代 的 。 


8.7.2 递归 的 定义 
每 一 个 算法 出 现在 它 本 身 的 定义 中 ， 该 算法 就 是 递归 和 定义 的 。 例 如 ， 阶 乘 函 数 可 以 如 
图 8-23 所 示 递 归 定 义 。 


] 若 n=0 . 1 若 m=0 
0 | XXX 2 ,3X 若 n> ,| Faotorial(n)-= nx Factorial(7n — 1) 若 n> | 
图 8-22 ” 阶 箭 的 和 迭代 定义 图 8-23 ”阶乘 的 递归 定义 


图 8-24 给 出 了 用 递归 分 解 阶乘 (3 )。 如 果 仔 细 研 究 该 图 ， 便 会 发 现 递归 解决 问题 有 两 
条 途径 。 首 先 将 问题 从 高 至 低 进行 分 解 ， 然 后 从 低 到 高 解决 它 。 

由 这 个 例子 看 ， 似 乎 递归 计算 花费 时 间 更 长 且 更 困难 。 那 为 什么 我 们 要 用 递归 呢 ? 虽然 
递归 在 使 用 笔 和 纸 来 解决 问题 时 看 起 来 很 困难 ， 但 如 果 使 用 计算 机 则 变 得 更 简单 和 优美 。 而 
且 ， 递 归 对 于 编程 人 员 和 程序 阅读 者 在 概念 上 很 容易 理解 。 
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Factorial (3) = 3 x Factorial (2) Factorial (3) = 3x2=6 
Factorial (2) = 2 x Factorial (1) Factorial (2) = 2x1=2 
Factorial (1) = 1 x Factorial (0) 


Factorial (0) = 1 


Factorial (1) = 1x1 =1 









图 8-24 ”阶乘 问题 的 递归 解决 步骤 


1. 迭代 解法 
让 我 们 用 和 迭代 算法 来 求解 阶乘 问题 。 这 个 算法 通常 包含 一 个 循环 ， 如 算法 8.6 所 示 。 


算法 8.6 ”阶乘 迭代 算法 


算法 ; Factorial (n) 
目的 ; 使 用 循环 求 一 个 整数 的 阶乘 
前 提 :; 给 定 n 
后 续 ; 无 
返回 ; n 1! 
{ 
EL 
Li 
while(i<n) 
{ 
中 
下 
} 
return F 


} 


2. 递归 解法 
阶乘 问题 的 递 解法 如 算法 8.7 所 示 。 它 不 需要 循环 ， 但 递归 概念 本 身 包 含 了 重复 。 在 递 
归 算 法 里 ， 阶 乘 算法 调用 自己 。 
算法 8.7 ”阶乘 递归 算法 


算法 ; Factorial (n) 
目的 ; 使 用 递归 求 一 个 整数 的 阶乘 
前 提 : 给 定 
后 续 : 无 
返回 ; n ! 
{ 
if (n=0) 
return 1 
else 
return nXFactorial (n-1) 
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8.8 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
e。 Aho, A., Hopcroft, J. and Ullman, J. The Design and Analysis of Computer Algorithms, 


Boston, MA: Addison-Wesley, 1974 

e。 Cormen, T., Leiserson, C. and Rivest, R. Introduction to Algorithms, New York: 
McGraw-Hill, 2003 

e Gries, D. The Science of Programming, New York: Springer, 1998 

e。 Tardos, E. and Kleinberg, J. Algorithm Design, Boston, MA: Addison-Wesley, 2006 

® Roberts, E. Thinking Recursively, New York: Wiley, 1998 


关键 术 语 

algorithm (算法 ) repetition (循环 ) 

binary search ( 折 半 查找 ) searching (查找 ) 

bubble sort( 冒 泡 排 序 ) selection (选择 ) 

decision (判断 ) selection sort (选择 排序 ) 
input data (输入 数据 ) sequence (顺序 ) 

insertion sort (插入 排序 ) sequential search (顺序 查找 ) 
loop〈 循 环 ) sorting (排序 ) 

output data (输出 数据 ) structure chart (结构 图 ) 
product (乘积 ) subalgorithm ( 子 算法 ) 
pseudocode( 伪 代码 ) summation ( 求 和 ) 

recursion (递归 ) Unified Modeling Language (UML ， 统 一 建 模 语 言 ) 
小 结 


。 非 正式 地 讲 ， 算 法 是 一 步 一 步 解决 问题 或 完成 任务 的 方法 。 更 正式 地 来 说 ， 算 法 定义 
为 一 组 明确 步骤 的 有 序 集 合 ， 它 产生 结果 并 在 有 限 的 时 间 内 终止 。 

。 计算 机 科学 家 已 经 为 结构 化 程序 或 算法 定义 了 三 种 结构 : 顺序 、 判 断 〈 选 择 ) 和 重复 
(循环 )。 

。 有 几 种 工具 能 用 来 表示 算法 : UML、 伪 代码 和 结构 图 。UML 是 算法 的 图 形 化 表示 ; 
伪 代 码 是 算法 类 似 英 语 的 表示 ; 结构 图 是 显示 算法 和 子 算法 间 关 系 的 高 级 设计 工具 。 
。 在 计算 机 科学 中 ， 有 几 种 算法 得 到 普遍 使 用 ， 以 至 于 它们 被 看 成 是 基本 算法 。 本 章 讨 

论 其 中 最 常见 的 算法 : 求 和 、 乘 积 、 求 最 小 值 与 最 大 值 、 排 序 和 查找 。 

。 在 计算 机 科学 中 ， 最 常见 的 一 种 应 用 就 是 排序 ， 它 是 数据 根据 其 值 的 大 小 进行 排序 的 
过 程 。 我 们 介绍 了 三 种 原始 但 基本 的 排序 算法 : 选择 排序 、 冒 泡 排序 和 插入 排序 。 这 
三 种 排序 算法 是 如 今 计 算 机 科学 中 快速 排序 的 基础 。 

。 计算 机 科学 中 另 一 种 常见 的 算法 是 查找 。 它 是 在 一 组 对 象 中 找到 目标 位 置 的 过 程 。 列 
表 有 两 种 基本 查找 方法 : 顺序 查找 和 折 半 查找 。 顺 序 查找 可 以 在 任意 列表 中 定位 数据 
项 ; 而 折 半 查找 需要 列表 是 排序 的 。 
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。 结构 化 编程 的 原则 要 求 算法 被 分 解 成 称 为 子 算法 的 小 单元 。 每 个 子 算法 依次 又 可 以 分 
成 更 小 的 子 算法 。 

。 通常 ， 有 两 种 方法 编写 求解 问题 的 算法 : 一 种 是 使 用 迭代; 另 一 种 是 使 用 递归 。 任 何 
时 候 只 要 算法 的 定义 不 涉及 算法 本 身 ， 它 就 是 迭代 的 。 任 何 时 候 只 要 算法 出 现在 它 的 
定义 中 ， 算 法 就 是 递归 定义 的 。 


8.9 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建 议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q8-1 算法 的 正式 定义 是 什么 ? 

Q8-2 给 出 用 于 结构 化 程序 设计 中 的 三 种 结构 的 定义 。 
Q8-3 ”UML 图 与 算法 有 何 关系 ? 

Q8-4 ”人 擅 代 码 与 算法 有 何 关系 ? 

Q8-5 ”排序 算法 的 用 途 是 什么 ? 

Q8-6 本 章 有 哪 三 种 基本 排序 算法 ? 

Q8-7 查找 算法 的 用 途 是 什么 ? 

Q8-8 本 章 讨论 的 基本 查找 算法 主要 有 哪 两 种 ? 

Q8-9 给 出 迭代 过 程 的 定义 和 一 个 例子 。 

Q8-10 给 出 递归 过 程 的 定义 和 一 个 例子 。 


练习 题 


”P8-1 使 用 求 和 算法 ， 画 一 张 表 ， 显 示 下 面 的 列表 中 每 个 整数 被 处 理 后 的 和 值 。 
20712970%81 -45 1 3%8 
P8-2 使 用 乘积 算法 ， 画 一 张 表 ， TN 
(27120 87 1 10 $20 
P8-3 使 用 FindLargest 算法 ， 画 一 张 表 ， 显示 下 面 的 列表 中 每 个 整数 被 处 理 后 的 Largest 的 值 。 
8 2 8 20 10°7320 5 
P8-4 使 用 FindSmallest 算法 ， 画 一 张 表 ， 显示 下 面 的 列表 中 每 个 整数 被 处 理 后 的 Smallest 的 值 。 





2 
P8-5 使 用 选择 排序 算法 ， 手工 排放 下 列 数据 列表 并 借助 表 给 出 每 轮 所 人 的 工作 ， 


14.°7 17523. 3154007567 78 
P8-6 使 用 冒 泡 排序 算法 ， 下 条 下 天 数据 列表 并 佛 助 家 阅 出色 所 所 的 工作 。 









* 


P8-7 





P8-8 一 个 列表 包含 以 下 元 素 。 前 两 人 元素 已 经 使 用 半 择 排序 算法 排 好 序 了 ， 那么 在 进行 了 选择 排序 
的 三 轮 后 列表 中 的 元 素 排序 结果 如 何 ? 
7 8 .267 44 1 130 230 98057 
P8-9 一 个 列表 包含 以 下 元 素 。 前 两 个 元 来 已 经 使 用 久光 排序 算法 排 好 序 了 ， 那么 在 进行 了 冒 泡 排序 
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P8-10 


P8-11 


P8-12 


P8-13 
P8-14 
P8-15 
P8-16 
P8-17 
P8-18 


P8-19 


P8-20 


P8-21 


P8-22 


P8-23 


P8-24 


P8-25 


P8-26 
P8-27 
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的 三 轮 后 列表 中 的 元 素 排序 结果 如 何 ? 
7 8 26 44° 13 23 .57 98 
一 个 列表 包含 以 下 元 素 。 前 两 个 元 素 已 经 使 用 插入 排序 算法 排 好 序 了 ， 那 么 在 进行 插入 排序 
的 三 轮 后 列表 中 的 元 素 排 序 结果 如 何 ? 
I 644 D3 Qs 
一 个 列表 包含 以 下 元 素 。 使 用 折 半 查找 算法 ， 跟 踪 查找 88 的 步骤 ， 要 求 给 出 每 一 步 中 first、 
mid 和 last 的 值 。 
‘813 17 :26 443 56 88 97: 
一 个 列表 包含 以 下 元 素 。 使 用 折 半 查找 算法 ， 跟踪 查找 20 的 步 又 ， 要 求 给 出 每 一 步 中 first、 
mid 和 last 的 值 。 
117 526° 44 56° 88 .97 
使 用 8.5.1 节 中 的 图 8-19 (顺序 查找 )， 显 示 查 找 目 标 11 (不 在 列表 中 ) 的 所 有 步 又 。 
使 用 8.5.5 节 中 的 图 8-20( 折 半 查 找 )， 显 示 查 找 目标 17 (不 在 列表 中 ) 的 所 有 步骤 。 
应 用 阶乘 算法 的 迭代 定义 ， 当 求 61 (6 的 阶乘 ) 的 值 时 ， 显 示 每 一 步 中 下 的 值 。 
应 用 阶乘 算法 的 递归 定义 ， 当 求 61 的 值 时 ， 显 示 每 一 步 中 F 的 值 。 
用 伪 代 码 写 出 一 个 递归 算法 ， 使 用 图 8-25 中 的 定义 ， 
求 两 整数 的 最 大 公约 数 ( gcd)。 在 这 个 定义 中 ， 表 达 
式 “x mody” 意 思 是 x 除 以 >?， 取 余数 作为 操作 的 值 。 
使 用 图 8-25 中 的 定义 ， 求 下 列 值 : 图 8-25 问题 P8-17 
a. gcd(7, 41) b. gcd(12, 100) c,. gcd(80, 4) d. gcd(17, 29) 
用 伪 代 码 写 一 递归 算法 ， 使 用 图 8-26 中 的 定义 ， 求 一 次 从 个 对 象 中 取 上 个 对 象 的 组 合 。 


_|x 若 y=0 
ged(x, y) = gcd(y,x mod y) 其 他 





图 8-26 问题 P8-18 


使 用 图 8-26 中 的 定义 ， 求 下 列 值 ; 

a. C(3, 2) b. C(5, 5) c. C(2, 7) d. C(4, 3) 

斐 波 那 契 序列 ( Fib(n)) 被 用 在 科学 和 数学 上 ， 如 图 8-27 所 示 。 用 伪 代 码 写 一 递归 算法 ， 求 
Fib(n) 的 值 。 


0 
Fib(n) = | 1 
Fib(n) = Fib(n — 1) + Fib(n — 2) 若 n>1 





图 8-27 问题 P8-21 


使 用 图 8-27 中 的 定义 ， 求 下 列 值 ; 

a, Fib(2) b. Fib(3) c. Fib(4) d. Fib(5) 

画 出 使 用 两 个 循环 的 选择 排序 算法 的 UML 图 。 缔 套 循 环 用 来 在 未 排序 的 子 列表 中 找 出 最 小 的 
元 素 。 

画 出 使 用 两 个 循环 的 冒 泡 排序 算法 的 UML 图 。 媒 套 循环 用 来 在 未 排序 的 子 列表 中 交换 相 邻 的 
数据 项 。 

画 出 使 用 两 个 循环 的 插入 排序 算法 的 UML 图 。 芯 套 循环 用 来 在 排序 的 子 列表 中 做 插入 工作 。 
画 出 使 用 子 算法 的 冒 泡 排序 算法 的 UML 图 。 子 算法 对 未 排序 的 子 列表 进行 冒 泡 排序 。 

画 出 使 用 子 算法 的 插入 排序 算法 的 UML 图 。 子 算法 对 排序 的 子 表 做 插 人 工作 。 
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P8-28 用 伪 代 码 写 出 8.5.1 节 图 8-9 中 的 UML 图 的 算法 。 

P8-29 用 伪 代 码 写 出 8.5.5 节 图 8-10 中 的 UML 图 的 算法 。 

P8-30 ”用 伪 代 码 写 出 使 用 两 个 嵌 套 循环 的 选择 排序 算法 。 

P8-31 用 伪 代 码 写 出 使 用 子 算法 的 选择 排序 算法 ， 子 算法 是 在 未 排序 的 子 列表 中 求 最 小 的 整数 。 
P8-32 用 伪 代 码 写 出 使 用 两 个 媒 套 循环 的 冒 泡 排 序 算 法 。 

P8-33 用 伪 代 码 写 出 使 用 子 算法 的 冒 泡 排 序 算法 ， 子 算法 是 在 未 排序 的 子 列表 中 做 冒 泡 工作 。 
P8-34 用 伪 代 码 写 出 使 用 两 个 柑 套 循环 的 插入 排序 算法 。 

P8-35 用 伪 代 码 写 出 使 用 子 算法 的 插入 排序 算法 ， 子 算法 是 在 未 排序 的 子 列表 中 做 插入 工作 。 
P8-36 用 伪 代 码 写 出 顺序 查找 算法 ， 包 含 如 果 目 标 找到 或 找 不 到 时 算法 的 终止 条 件 。 

P8-37 用 和 伪 代 码 写 出 折 半 查找 算法 ， 包含 如 果 目 标 找 到 或 找 不 到 时 算法 的 终止 条 件 。 

P8-38 ”使 用 乘积 算法 的 UML 图 ， 画 图 计算 x" 的 值 ，x 和 是 两 个 给 定 的 整数 。 

P8-39 ”用 伪 代 码 写 一 算法 , 求 xw' 的 值 ，x 和 nn 是 两 个 给 定 的 整数 。 
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第 8 章 讨论 了 算法 ， 显 示 了 如 何 用 UML 或 伪 代 码 编写 算法 解决 问题 。 本 章 将 学 习 能 实 
现 伪 代码 的 编程 语言 ， 或 者 是 能 实现 解决 方案 的 UML 描述 的 编程 语言 。 本 章 并 不 是 要 教会 
一 种 特殊 的 编程 语言 ， 而 是 旨 在 比较 和 对 照 不 同 的 语言 。 

目标 \ 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 描述 从 机 器 语言 到 高 级 语言 的 编程 语言 演化 ; 

。 理解 如 何 使 用 解释 器 或 编译 器 将 高 级 语言 中 的 程序 翻译 成 机 器 语言 ; 

。 区 分 4 种 计算 机 语言 模式 ; 

。 理解 过 程式 模式 和 在 模式 中 程序 单元 与 数据 项 间 的 交互 ; 

。 理 解 面向 对 象 模式 和 在 这 种 模式 中 程序 单元 与 对 象 间 的 交互 ; 

。 定义 函数 式 模式 ， 理 解 它 的 应 用 ; 

。 定义 声明 式 模式 ， 理 解 它 的 应 用 |; 

。 定义 过 程式 和 面向 对 象 语言 中 的 常见 概念 。 


9.1 演化 

对 计算 机 而 言 ， 要 编写 程序 就 必须 使 用 计算 机 语言 。 计 算 机 语言 是 指 编写 程序 时 ， 根 据 
事先 定义 的 规则 (语法 ) 而 写 出 的 预定 语句 集合 。 计 算 机 语言 经 过 多 年 的 发 展 已 经 从 机 器 语 
言 演化 到 高 级 语言 。 


9.1.1 机 器 语言 


在 计算 机 发 展 的 早期 ， 唯 一 的 程序 设计 语言 是 机 器 语言 。 每 台 计 算 机 有 其 自己 的 机 器 语 
言 ， 这 种 机 器 语言 由 “0” 和 “1” 序列 组 成 。 在 第 5 章 中 ,我 们 看 到 在 一 台 原 始 假想 的 计算 


机 中 ， 我 们 需要 用 11 行 代码 去 读 两 个 整数 、 把 它们 相 加 并 输出 结果 。 当 用 机 器 语言 来 写 时 ， 
这 些 代 码 行 就 成 了 11 行 二 进 制 代码 ， 每 一 行 16 位 ， 如 表 9-1 所 示 。 


表 9-1 两 个 整数 相 加 的 机 器 语言 代码 


(1FEF)'s 0011 0010 0000 0001 
(240F)is 0010 0100 0010 0010 
GE po01 1111 0100 0010 
(241F)'s 0010 1111 1111 1111 
{1040)i5 0000 0000 0000 0000 
ne | moo | 


机 器 语言 是 计算 机 硬件 唯一 能 理解 的 语言 ， 它 由 具有 两 种 状态 的 电子 开关 构成 : 关 ( 表 
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示 0) 和 开 (表示 1 )。 
计算 机 唯一 识别 的 语言 是 机 器 语言 。 \ 
虽然 用 机 器 语言 编写 的 程序 真实 地 表示 了 数据 是 如 何 被 计算 机 操纵 的 。 但 它 至 少 有 两 个 

缺点 : 首先 ， 它 依赖 于 计算 机 。 如 果 使 用 不 同 的 硬件 ， 那 么 一 台 计算 机 的 机 器 语言 与 男 一 台 

计算 机 的 机 器 语言 就 不 同 。 其 次 ， 用 这 种 语言 编写 程序 是 非常 单调 乏味 的 ， 而 且 很 难 发 现 错 

误 。 现 在 我 们 将 机 器 语言 时 代称 为 编程 语言 的 第 一 代 。 

9.1.2 ”汇编 语言 


编程 语言 中 接 下 来 的 演化 是 伴随 着 用 带 符号 或 助 记 符 的 指令 和 地 址 代替 二 进 制 码 而 发 生 
的 。 因 为 它们 使 用 符号 ， 所 以 这 些 语言 首先 被 称 为 符号 语言 。 这 些 助 记 符 语言 后 来 就 被 称 为 
汇编 语言 。 假 想 计 算 机 用 于 替代 机 咒语 言 的 汇编 语言 (如 表 9-2 所 示 ) 显示 在 程序 9.1 中 。 


表 9-2 两 个 整数 相 加 的 汇编 语言 代码 


汇编 语言 代码 说 明 
LOAD RF Keyboard 从 键盘 控制 器 中 取 数 ， 存 到 寄存 器 F 中 
STORE Numberl RF 把 寄存 器 下 中 的 内 容 存 到 Numberl 中 
LOAD RF Keyboard 从 键盘 控制 器 中 取 数 ， 存 到 寄存 器 下 中 
STORE Number2 RF 把 寄存 器 F 中 的 内 容 存 到 Number2 中 
LOAD RO Number] 把 Numberl 中 的 内 容 存 人 寄存 器 0 中 
LOAD RI Number2 把 Number2 中 的 内 容 存 人 寄存 器 1 中 
ADDI R2 RO RI 把 寄存 器 0 和 寄存 器 1 相 加 ， 结 果 放 入 寄存 器 2 中 
STORE Result R2 把 寄存 器 2 的 内 容 存 人 Result 中 
LOAD RF Result 把 Result 中 的 值 放 人 寄存 器 F 中 
STORE Monitor RF 把 寄存 器 F 中 的 值 存 人 显示 控制 器 中 
HAILT 停止 


称 为 汇编 程序 的 特殊 程序 用 于 将 汇编 语言 代码 翻译 成 机 融 语 言 。 


9.1.3 ”高 级 语言 


尽管 汇编 语言 大 大 提高 了 编程 效率 ， 但 仍然 需要 程序 员 在 所 使 用 的 硬件 上 花费 大 部 分 精 
力 。 用 符号 语言 编程 也 很 枯燥 ， 因 为 每 条 机 器 指令 都 必须 单独 编码 。 为 了 提高 程序 员 效 率 以 
及 从 关注 计算 机 转 到 关注 要 解决 的 问题 ， 促 进 了 高 级 语言 的 发 展 。 

高 级 语言 可 移植 到 许多 不 同 的 计算 机 ， 使 程序 员 能 够 将 精力 集中 在 应 用 程序 上 ， 而 不 
是 计算 机 结构 的 复杂 性 上 。 高 级 语言 旨 在 使 程序 员 摆 脱 汇编 语言 烦琐 的 细节 。 高 级 语言 同 汇 
编 语 言 有 一 个 共性 : 它们 必须 被 转化 为 机 器 语言 ， 这 个 转化 过 程 称 为 解释 或 编译 (本 章 后 面 
介绍 )。 

数 年 来 ， 人 们 开发 了 各 种 各 样 的 语言 ， 最 著名 的 有 BASIC、COBOL、Pascal、Ada、C、 
C++ 和 Java。 程 序 9-1 显示 了 两 个 整数 相 加 的 C++ 语言 代码 。 虽 然 程序 看 起 来 有 点 长 ， 但 


有 些 代码 行 是 文档 (注释 )。 
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程序 9-1 C++ 中 的 加 法 程序 
大 全 This program reads two integers from keyboard and prints their sun， 


Written by : 
Date: 
mh 
#include<iostream> 
using namespace Std' 
int main() 


{ 
// Local Declarations 


int number 1; 
int number 2; 
int result; 
// Statements 
cin >> number 1;} 
cin >> number 2; 
result = number 1 + number 2) 
cout << result,; 
return 0; 
}// main 


9.2 翻译 

当今 程序 通常 是 用 一 种 高 级 语言 来 编写 。 为 了 在 计算 机 上 运行 程序 ， 程 序 需 要 被 翻译 成 
它 要 运行 在 其 他 的 计算 机 的 机 器 语言 。 高 级 语言 程序 被 称 为 源 程序 。 被 翻译 成 的 机 器 语言 
序 称 为 目标 程序 。 有 两 种 方法 用 于 翻译 : 编译 和 解释 。 


9.2.1 编译 
编译 程序 通常 把 整个 源 程 序 翻译 成 目标 程序 。 


9.2.2 解释 

有 些 计算 机 语言 使 用 解释 器 把 源 程序 翻译 成 目标 程序 。 解 释 是 指 把 源 程 序 中 的 每 一 行 翻 
译 成 目标 程序 中 相应 的 行 ， 并 执行 它 的 过 程 。 但 是 ， 我 们 需要 意识 到 在 解释 中 的 两 种 趋势 : 
在 Java 语言 之 前 被 有 些 程序 使 用 的 和 Java 使 用 的 解释 。 


1. 解释 的 第 一 种 方法 

在 Java 语言 之 前 的 有 些 解释 式 语言 (如 BASIC 和 APL) 使 用 一 种 称 为 解释 的 第 一 种 方 
法 的 解释 过 程 ， 因 为 缺少 其 他 任何 的 名 字 ， 所 以 称 为 解释 的 第 一 种 方法 。 在 这 种 解释 中 ， 源 
程序 的 每 一 行 被 翻译 成 被 其 使 用 的 计算 机 上 的 机 器 语言 ， 该 行 机 器 语言 被 立即 执行 。 如 果 在 
翻译 和 执行 中 有 任何 错误 ， 过 程 就 显示 消息 ， 其 余 的 过 程 就 被 中 止 。 程 序 需要 被 改正 ， 再 次 


从 头 解释 和 执行 。 第 一 种 方法 被 看 成 是 一 种 慢 的 过 程 ， 这 就 是 大 多 数 语言 使 用 编译 而 不 是 解 
释 的 原因 。 

2. 解释 程序 的 第 二 种 方法 

随 着 Java 的 到 来 ， 一 种 新 的 解释 过 程 就 被 引入 了 。Java 语言 能 向 任何 计算 机 移植 。 为 
了 取得 可 移植 性 ， 源 程序 到 目标 程序 的 翻译 分 成 两 步 进行 : 编译 和 解释 。Java 源 程 序 首先 被 
编译 ， 创 建 Java 的 字 节 代码 ， 字 节 代 码 看 起 来 像 机 器 语言 中 的 代码 ， 但 不 是 任何 特定 计算 
机 的 目标 代码 ， 它 是 一 种 虚拟 机 的 目标 代码 ， 该 虚拟 机 称 为 Java 虚拟 机 或 JVM。 字 节 代 码 
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然后 能 被 任何 运行 JVM 模拟 器 的 计算 机 编译 或 解释 ， 也 就 是 运行 字 节 代码 的 计算 机 只 需要 
JVM 模拟 器 ， 而 不 是 Java 编译 器 。 


9.2.3 ”翻译 过 程 
编译 和 解释 的 不 同 在 于 ， 编 译 在 执行 前 翻译 整个 源 代码 ， 而 解释 一 次 只 翻译 和 执行 源 代 

码 中 的 一 行 。 但 是 ， 两 种 方法 都 遵循 图 9-1 中 显示 的 相同 的 翻译 过 程 。 

可 编码 指令 


指令 









源 文件 


图 9-1 源 代码 翻译 过 程 


1. 词法 分 析 器 | 
词法 分 析 器 一 个 符号 接 一 个 符号 地 读 源 代码 ， 创 建 源 语言 中 的 助 记 符 表 。 例 如 ，5 个 符 
号 w、h、i、1、e 被 读 入 ， 组 合 起 来 就 形成 了 C、C++ 或 Java 语言 中 的 助 记 符 while。 


2. 语法 分 析 器 

语法 分 析 器 分 析 一 组 助 记 符 ， 找 出 指令 。 例 如 ， 语 法 分 析 器 使 用 助 记 符 “xz” "=” 0” 
创建 C 语言 中 的 赋值 语句 “x = 0”。 在 第 18 章 中 讨论 语言 识别 时 ， 我 们 将 更 详细 地 讨论 词 
法 分 析 器 和 语法 分 析 器 的 功能 。 

3. 语义 分 析 器 


语义 分 析 器 检查 语法 分 析 器 创建 的 句子 ， 确 保 它们 不 含有 二 义 性 。 计 算 机 语义 通常 是 无 
二 义 性 的 ， 这 意味 着 这 一 步骤 或 者 是 在 翻译 器 中 被 省 略 ， 或 者 是 其 责任 被 最 小 化 。 第 18 章 
也 详细 讨论 语义 分 析 。 

4. 代码 生成 絮 

在 无 二 义 性 指令 被 语义 分 析 器 创建 之 后 ， 每 条 指令 将 转化 为 一 组 程序 将 要 在 其 上 运行 的 
计算 机 的 机 器 语言 。 这 个 是 由 代码 生成 器 完成 的 。 


9.3 ”编程 模式 

当今 计算 机 语言 按照 它们 使 用 的 解决 问题 的 方法 来 分 类 。 因 此 ， 模 式 是 计算 机 语言 看 竺 
要 解决 问题 的 一 种 方式 。 计 算 机 语言 可 分 成 4 种 模式 : 过 程式 (强制 性 )、 面 向 对 象 、 函 数 
式 和 声明 式 。 图 9-2 总 结 了 这 些 范式 。 


计算 机 语言 模式 





D FORTRAN OD Smalltalk 口 LISP 口 Prolog 
D COBOL DC++ DO Scheme 

DOD BASIC 口 Visual Basic 

OC OC# 

口 Pascal 口 Java 

口 Ada 


图 9-2 “编程 语言 分 类 
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9.3.1 过 程式 模式 


在 过 程式 模式 (或 强制 性 模式 ) 中 ， 我 们 把 程序 看 成 是 操纵 被 动 对 象 的 主动 主体 。 我 们 
在 日 常生 活 中 遇 到 许多 被 动 对 象 : 石头 、 书 、 灯 等 。 一 个 被 动 对 象 本 身 不 能 发 出 一 个 动作 ， 
但 它 能 从 主动 主体 接收 动作 。 : 

过 程式 模式 下 的 程序 就 是 主动 主体 ,该 主体 使 用 称 为 数据 或 数据 项 的 被 动 对 象 。 作 为 
被 动 对 象 的 数据 项 存储 在 计算 机 的 内 存 中 ， 程 序 操纵 它们 。 为 了 操纵 数据 ， 主 动 主体 ( 答 
序 ) 发 出 动作 ， 称 之 为 过 程 。 例 如 ， 考 虑 一 个 打印 文件 内 容 的 程序 ， 为 了 能 被 打印 ， 文 件 需 
要 存储 在 内 存 中 (或 一 些 像 内 存 一 样 的 寄存 器 中 )。 文 件 是 一 个 被 动 对 象 或 一 个 被 动 对象 集 
合 。 为 了 打印 文件 ， 程 序 使 用 了 一 个 称 为 print 的 过 程 。 过 程 print 通常 包括 了 需要 告诉 计算 
机 如 何 打印 文件 中 每 一 个 字符 的 所 有 动作 。 程 序 调用 过 程 print。 在 过 程式 模式 中 ， 对 象 ( 文 
件 ) 和 过 程 (print) 是 完全 分 开 的 实体 。 对 象 文件) 是 一 个 能 接收 print 动作 或 其 他 一 些 动 
作 (如 删除 、 复 制 等 ) 的 独立 实体 。 为 了 对 文件 应 用 这 些 动作 中 的 任何 一 个 ， 我 们 需要 一 个 
作用 于 文件 的 过 程 。 过 程 print (或 复制 或 删除 ) 是 编写 的 一 个 独立 实体 ， 程 序 只 是 触发 它 。 

为 了 避免 每 次 需要 打印 文件 时 都 编写 一 个 新 过 程 ， 我 们 可 以 编写 一 个 能 打印 任何 文件 的 
通用 过 程 。 当 写 这 个 过 程 时 ， 对 文件 名 的 每 个 引用 都 被 诸如 F、FILE 之 类 的 符号 替代 。 当 过 
程 被 调用 (触发) 时， 我 们 传递 实际 要 打印 的 文件 名 给 过 程 ， 这 样 可 以 编写 一 个 过 程 print， 
在 程序 中 调用 两 次 ， 打 印 不 同 的 文件 。 图 9-3 显示 了 程序 如 何 能 调用 不 同 的 预定 义 过 程 ， 打 
印 或 删除 不 同 的 目标 文件 。 


printFile(File 1) 


deleteFile(File2) 





图 9-3 ”过 程式 模式 的 概念 


我 们 需要 把 过 程 与 程序 触发 区 分 开 。 程 序 不 定义 过 程 (后 面 解 释 )， 它 只 触发 或 调用 过 
程 。 过 程 必须 已 经 存在 。 

当 使 用 过 程式 高 级 语言 时 ， 程 序 仅 由 许多 过 程 调 用 构成 ， 除 此 之 外 没有 任何 东西 。 这 
不 是 显而易见 的 ， 但 即使 使 用 像 加 法 运算 符 (+) 这 样 的 简单 数学 运算 符 时 ， 我 们 也 是 正在 
使 用 一 个 过 程 调用 一 个 已 经 编写 的 过 程 。 例 如 ， 当 使 用 表达 式 A+B 将 两 个 对 象 A 和 B 的 值 
相 加 时 ， 我 们 就 是 在 调用 过 程 add， 传 递 两 个 对 象 的 名 字 给 过 程 。 过 程 add 需要 两 个 操作 对 
象 。 它 把 两 个 对 象 的 值 相 加 ， 返 回 结果 。 换 言 之 ,表达 式 A+B 是 add (A，B) 的 缩写 。 语 
言 的 设计 者 编写 了 这 些 过 程 ， 我 们 才能 调用 它 。 

如 果 我 们 考虑 过 程 和 操作 对 象 ， 那 么 过 程式 模式 的 概念 就 变 得 更 为 简单 ， 且 容易 理解 。 
这 种 模式 的 程序 由 三 部 分 构成 : 对 象 创建 部 分 、 一 组 过 程 调用 和 每 个 过 程 的 一 组 代码 。 有 些 
过 程 在 语言 本 身 中 已 经 被 定义 。 通 过 组 合 这 些 代码 ， 开 发 者 可 以 建立 新 的 过 程 。 

图 9-4 显示 了 过 程式 程序 的 三 个 组 成 部 分 。 在 语言 中 也 有 额外 的 助 记 符 用 来 界定 或 组 织 
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调用 ， 但 这 个 图 中 并 没有 显示 出 来 。 


一 些 过 程式 语言 rr 

在 过 去 的 几 十 年 中 ， 一 些 高 级 强制 性 (过 程式 ) 语言 发 展 。。 上 -的 建 ( 明 ) 上 
起 来 ,如 FORTRAN、COBOL、Pascal、C 和 Ada。 BR 

FORTRAN :| 四 上 

FORTRAN (FORmula TRANSslation )， 由 Jack Backus 
领导 下 的 一 批 IBM 工程 师 所 设计 ， 于 1957 年 变 成 商用 的 。 
FORTRAN 是 第 一 代 高 级 语言 。 在 过 去 的 40 年 中 ，FORTRAN 
经 历 了 多 个 版 本 : FORTRAN、FORTRAN 下 、FORTRAN IV 、 图 94 过 程式 程序 的 组 成 部 分 
FORTRAN 77、FORTRAN 99 和 HPF (高 性 能 FORTRAN )。 
最 新 版 本 ( HPF) 用 于 高 速 多 处 理 器 计算 机 系统 。FORTRAN 所 具备 的 一 些 特征 使 得 40 年 后 
它 仍 然 是 科学 或 工程 应 用 中 的 理想 语言 。 这 些 特征 概括 如 下 : 

。 高 精度 算法 。 

。 处理 复杂 数据 的 能 力 。 

。 指数 运算 (a”)。 

COBOL 

COBOL (COmmon Business-Oriented Language) 由 一 批 计算 机 专家 在 美国 海军 的 Grace 
Hopper 指导 下 设计 出 来 。COBOL 有 一 个 特定 的 设计 目标 : 作为 商业 编程 语言 使 用 。 商 业 环 
境 中 的 问题 完全 不 同 于 工程 环境 中 的 问题 。 商 业 中 程序 设计 的 要 求 概括 如 下 

。 快速 访问 文件 和 数据 库 。 

。 快速 更 新 文件 和 数据 库 。 

。 生成 大 量 的 报表 。 

。 界面 友好 的 格式 化 的 输出 。 

Pascal 

Pascal 由 Niklaus Wirth 于 1971 年 在 瑞士 的 苏黎世 发 明 ， 根 据 17 世纪 发 明 Pascaline 计 
算 器 的 法 国 数 学 家 、 哲 学 家 Blaise Pascal 来 命名 。Pascal 设计 时 有 一 个 特定 目标 通过 强调 
结构 化 编程 方法 来 教 初学 者 编程 。 尽 管 Pascal 成 为 学 术 中 最 流行 的 语言 ， 但 它 从 未 在 工业 中 
达到 同等 流行 的 程度 。 现 在 的 过 程式 语言 归功 于 该 语言 。 

C 

C 语言 是 由 贝尔 实验 室 的 Dennis Ritchie 在 20 世纪 70 年 代 初 期 发 明 的 。 最 初 用 于 编写 
操作 系统 和 系统 软件 ( UNIX 操作 系统 的 大 部 分 是 用 C 编写 的 )。 后 来 ， 由 于 以 下 原因 而 在 
程序 员 中 流行 : | 

。C 有 一 个 结构 化 的 高 级 编程 语言 应 有 的 所 有 高 级 指令 ， 使 程序 员 无 须知 道 硬件 细节 。 

。C 也 具有 一 些 低级 指令 ， 使 得 程序 员 能 够 直接 、 快 速 地 访问 硬件 。 相 对 于 其 他 高 级 语 

言 ，C 更 接近 于 汇编 语言 ， 这 使 得 它 对 系统 程序 设计 员 来 说 是 一 种 好 语言 。 

。C 是 非常 有 效 的 语言 ， 指 令 短 。 这 种 简洁 吸引 了 想 编写 短程 序 的 程序 员 。 

Ada 

Ada 是 根据 Lord Byron 的 女儿 Augusta Ada Byron 和 助手 Charles Babbage (分 析 引 擎 
的 发 明 者 ) 的 名 字 来 命名 的 。Ada 是 为 美国 国防 部 (DoD) 而 开发 的 ， 并 成 为 所 有 DoD 承包 
人 使 用 的 统一 语言 。Ada 有 3 个 特征 使 其 成 为 DoD 和 工业 的 流行 语言 : 





。Ada 有 其 他 过 程式 语言 那样 的 高 级 指令 。 
。Ada 有 人 允许 实时 处 理 的 指令 ， 从 而 便于 过 程控 制 。 
。Ada 具有 并 行 处 理 能 力 ， 可 以 在 具有 多 处 理 器 的 主机 上 运行 。 


9.3.2 面向 对 象 模式 
面向 对 象 模式 处 理 活动 对 象 ， 而 不 是 被 动 对 象 。 我 们 在 日 常生 活 中 遇 到 许多 活动 对 象 : 
汽车 、 自 动 门 、 洗 盘 机 等 。 在 这 些 对 象 上 执行 的 动作 都 包含 在 这 些 对 象 中 : 对 象 只 需要 接收 


合适 的 外 部 刺激 来 执行 其 中 一 个 动作 。 

回 到 我 们 在 过 程式 模式 中 的 例子 ， 在 面向 对 象 模 式 中 的 文件 能 把 所 有 的 被 文件 执行 的 过 
程 〈 在 面向 对 象 模 式 中 称 为 方法 ) 打包 在 一 起 ， 这 些 过 程 有 打印 、 复 制 、 删 除 等 。 在 这 种 模 
式 中 的 程序 仅仅 向 对 象 发 送 相应 请 求 (打印 、 复 制 、 删 除 等 ) 文件 就 会 被 打印 、 复 制 或 删 


除 。 图 9-5 说 明了 这 样 的 概念 。 


print 方 法 


"ie1.print pn 
Filel .print COPYy 方 法 


File2.dejete 


delete 方 法 





活动 对 象 
图 9-5 面向 对 象 模式 的 概念 

这 些 方法 被 相同 类 型 的 所 有 对 象 共 享 ， 也 被 从 这 些 对 象 继承 的 其 他 对 象 共 享 ， 如 后 面 
将 讨论 的 。 如 果 程 序 要 打印 文件 File1， 它 只 需要 发 送 活 动 对 象 所 需 的 刺激 ， 文 件 Filel 就 被 
打印 。 

比较 过 程式 模式 和 面向 对 象 模式 (图 9-3 和 图 9-5 )， 我 们 看 出 过 程式 模式 中 的 过 程 是 独 
立 的 实体 ,但 面向 对 象 模式 中 的 方法 是 属于 对 象 领地 的 。 

1. 类 

如 图 9-5 所 示 ， 相 同类 型 的 对 象 (如 文件 ) 需要 一 组 方法 ， 这 些 
方法 显示 了 这 类 对 象 对 来 自 对 象 “ 领 地 ”外 的 刺激 的 反应 。 为 了 创 
建 这 些 方法 ， 面 向 对 象 语言 ， 如 C++、Java 和 C# ( 读 作 “C sharp”) 
使 用 称 为 类 的 单元 ， 如 图 9-6 所 示 。 程 序 单元 的 准确 格式 因 不 同 的 面 
问 对 象 语言 而 不 同 (参见 附录 F)。 

2. 方法 

总 体 上 ， 方 法 的 格式 与 有 些 过 程式 语言 中 用 的 函数 非常 相似 。 每 
个 方法 有 它 的 头 、 局 部 变量 和 语句 。 这 就 意味 着 我 们 对 过 程式 语言 所 
讨论 的 大 多 数 特性 都 可 以 应 用 在 为 面向 对 象 程序 所 写 的 方法 上 。 换 言 
之 ， 我 们 可 以 认为 面向 对 象 语言 实际 上 是 带 有 新 的 理念 和 新 的 特性 的 过 程式 语言 的 扩展 。 例 
如 ，C++ 语 言 就 是 一 个 面向 对 象 的 C 语 言 的 扩展 。C++ 语言 甚至 可 以 作为 不 需要 或 极 少 使 


用 对 象 的 过 程式 语言 使 用 。Java 语言 是 C++ 的 扩展 ， 但 它 是 一 个 完全 的 面向 对 象 的 语言 。 





图 9-6 类 的 组 成 
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| 
3. 继承 性 
在 面向 对 象 模式 中 ， 作 为 本 质 ， 一 个 对 象 能 从 另 一 个 对 象 继承 。 这 个 概念 被 称 为 继承 


性 。 当 一 般 类 被 定义 后 ， 我 们 可 以 定义 继承 了 一 般 类 中 一 些 特 性 的 更 具体 的 类 ， 同 时 这 些 类 
具有 一 些 新 特性 。 例 如 ， 当 一 个 几何 形状 类 被 定义 后 ， 我 们 就 可 以 定义 称 为 矩形 的 类 。 和 矩形 
是 具有 额外 特性 的 几何 形状 。 

4. 多 态 性 

多 态 性 意思 是 “许多 形状 ” 。 在 面向 对 象 模式 中 的 多 态 性 是 指 我 们 可 以 定义 一 些 具有 相 
同名 字 的 操作 ， 而 这 些 操作 在 相关 类 中 做 不 同 的 事情 。 例 如 ， 我 们 定义 了 两 个 类 : 矩形 和 
圆 ， 都 是 从 几何 形状 类 继承 下 来 的 。 我 们 定义 名 字 都 为 area 的 两 个 操作 ， 一 个 在 矩形 类 中 ; 
一 个 在 圆 类 中 。 它 计算 矩形 或 圆 的 面积 。 两 个 操作 有 相同 的 名 字 ， 但 做 不 同 的 事情 ， 因 为 计 
算 和 矩形 的 面积 和 计算 圆 的 面积 需要 不 同 的 操作 数 和 操作 。 

和. 一些 面 癌 对象 语言 

人 们 已 经 发 明了 一 些 面向 对 象 语言 。 我 们 简要 讨论 其 中 两 种 语言 的 特性 : C++ 和 Java。 

C++ 

C++ 语言 是 由 贝尔 实验 室 Bjarne Stroustrup 等 人 开发 出 来 的 ， 是 比 C 语 言 更 高 级 的 一 
种 计算 机 编程 语言 。 它 使 用 类 来 定义 相似 对 象 的 通用 属性 以 及 可 以 应 用 于 它们 本 身 的 各 种 
操作 。 例 如 ， 程 序 员 可 以 定义 一 个 几何 体 类 ( Geometrical Shapes) 和 所 有 二 维 图 形 所 共用 的 
属性 ， 如 中 心 、 边 数 等 。 这 个 类 也 可 以 定义 出 可 以 应 用 于 几何 体 本 身 的 操作 (函数 或 方法 )， 
例如 ， 计 算 并 打印 出 面积 、 周 长 、 中 心 点 的 坐标 等 。 一 个 程序 可 以 创建 不 同 几何 体 类 的 对 
象 ， 每 个 对 象 有 不 同 的 中 心 点 和 边 数 。 程 序 可 以 为 每 个 对 象 计算 并 打印 出 面积 、 周 长 和 中 心 
坐标 等 。 

C++ 语言 的 设计 遵循 三 条 基本 原则 特性 : 封装 、 继 承 和 多 态 。 

Java 

Java 是 由 Sun Microsystems 公司 开发 的 ， 它 在 C 和 C++ 的 基础 上 发 展 而 来 ， 但 是 C++ 
的 一 些 特性 〈 如 多 重 继承 等 ) 从 语言 中 被 移 除 ， 从 而 使 Java 更 健壮 。 另 外 ， 该 语言 是 完全 面 
问 类 操作 的 。 在 C++ 中 ， 你 甚至 可 以 不 用 定义 类 就 能 解决 问题 。 而 在 Java 中 ， 每 个 数据 项 
都 属于 一 个 类 。 

Java 中 的 程序 可 以 是 一 个 应 用 程序 也 可 以 是 一 个 小 程序 。 应 用 程序 是 指 一 个 可 以 完全 
独立 运行 的 程序 。 小 程序 则 是 嵌入 在 超 文本 标记 语言 (参见 第 6 章 ) 中 的 程序 ， 存 储 在 服务 
钱 上 并 由 浏览 器 运行 。 浏 览 器 也 可 以 把 它 从 服务 器 端 下 载 到 本 地 运行 。 

在 Java 中 ， 应 用 程序 (或 小 程序 ) 是 类 以 及 类 实例 的 集合 。Java 自 带 的 丰富 类 库 是 它 
的 有 趣 特征 之 一 。 尽 管 C++ 也 提供 类 库 ， 但 在 Java 中 用 户 可 以 在 提供 的 类 库 基础 上 构建 
新 类 。 

在 Java 中 ， 程 序 的 执行 也 是 独 具 特 色 的 。 构 建 一 个 类 并 把 它 传 给 编译 器 。 由 编译 器 来 
调用 类 的 方法 。Java 的 另 一 大 有 趣 的 特点 是 多 线程 。 线 程 是 指 按 顺序 执行 的 动作 序列 。C++ 
只 允许 单线 程 执行 (整个 程序 作为 单线 程 )， 但 是 Java 允许 多 线程 执行 ( 几 行 代码 同时 执行 )。 


9.3.3 函数 式 模式 
在 函数 式 模式 中 程序 被 看 成 是 一 个 数学 函数 。 关 于 这 人 一点， 函数 是 把 一 组 输入 映射 到 一 
组 输出 的 黑 盒子 〈 图 9-7 )。 
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例如 ， 求 和 可 以 被 认为 是 具有 nn 个 输入 和 1 个 输出 的 函数 。 该 函数 实现 n 个 输入 值 相 加 


得 到 总 和 并 最 终 输 出 求 和 结果 。 函 数 式 语言 主要 实现 
下 面 的 功能 : 输入 输出 
。 函 数 式 语言 预定 义 一 系列 可 供 任何 程序 员 调用 
的 原始 (原子 ) 函数 。 图 9-7 “函数 式 语言 中 的 函数 


。 函数 式 语言 允许 程序 员 通 过 铬 干 原始 函数 的 组 


合 创建 新 的 函数 。 
例如 ， 定 义 一 个 称 为 first 的 原始 函数 ， 由 它 来 完成 从 一 个 数据 列表 中 抽取 第 一 个 元 素 


的 功能 。 再 定义 另 一 个 函数 rest， 由 它 完成 从 一 个 数据 列表 中 抽取 出 除 第 一 个 元 素 以 外 的 所 
有 元 素 。 通 过 两 个 函数 的 组 合 使 用 ， 可 以 在 一 个 程序 中 定义 一 个 函数 来 完成 对 第 三 个 元 素 的 
抽取 ， 如 图 9-8 所 示 。 


(11, 8, 9, 10, 6) (8, 9, 10, 6) 






(7, 11, 8, 9, 10, 6) 


第 三 个 元 素 


图 9-8 提取 列表 中 的 第 三 个 元 素 


函数 式 语言 相对 过 程式 语言 具有 两 方面 优势 : 它 支 持 模 块 化 编程 并 且 人 允许 程序 员 使 用 
已 经 存在 的 函数 来 开发 新 的 函数 。 这 两 个 因素 使 得 程序 员 能 够 编写 出 庞大 而 且 不 易 出 错 的 
程序 。 

一 些 函 数 式 语言 

我 们 以 LISP 和 Scheme 为 例 来 简要 介绍 函数 式 语 言 。 


LISP 
表 处 理解 释 语 言 (LISt Programming，LISP) 是 20 世纪 60 年 代 早 期 由 麻 省 理工 学 院 科 


研 小 组 设计 开发 的 。 它 是 一 种 把 表 作 为 处 理 对 象 的 语言 。 

Scheme 

表 处 理解 释 语言 没有 统一 标准 化 。 不 久之 后 ， 就 有 许多 不 同 的 版 本 流传 于 世 。 实 际 使 用 
的 标准 是 由 麻 省 理工 学 院 在 20 世纪 70 年 代 早 期 开发 的 ， 称 为 Scheme。 

Scheme 语言 定义 了 一 系列 原始 函数 来 解决 问题 。 函 数 名 和 函数 的 输入 列表 写 在 括号 内 ， 
结果 是 一 个 可 用 于 其 他 函数 输入 的 列表 。 例 如 ， 有 一 个 函数 car， 用 来 从 列表 中 取出 第 一 个 
元 素 。 第 二 个 函数 cdr 用 来 从 列表 中 取出 除 第 一 个 元 素 以 外 的 所 有 元 素 。 两 个 函数 如 下 : 


(Car 2 3 1 8 11 17 20) ~*2 
(Sar 2 3 8 LE Er 20) =*3 TF E720 


现在 可 以 通过 组 合 这 两 个 函数 来 完成 从 列表 中 取出 第 三 个 元 素 的 函数 。 
(Car TiCGG { cadr list:.) ) 


如 果 将 上 面 的 函数 应 用 于 列表 2 3 7 8 11 17 20， 结 果 是 取出 7。 我 们 来 分 析 一 下 ， 最 里 
面 的 括号 取出 列表 3 7 8 11 17 20。 中 间 一 层 括 号 取出 列表 7 8 11 17 20。 再 通过 函数 car 取 


出 该 列表 的 第 一 个 元 素 7。 
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9.3.4 ”声明 式 模式 

声明 式 模 式 依据 逻辑 推理 的 原则 响应 查询 。 它 是 在 由 希腊 数学 家 定义 的 规范 的 逻辑 基础 
上 发 展 而 来 的 ， 并 且 后 来 发 展 成 为 一 阶 谓词 演算 (first-order predicate calculus)。 

逻辑 推理 以 推导 为 基础 。 敢 辑 学 家 根据 已 知 正 确 的 一 些 论断 (事实 )， 运 用 逻辑 推理 的 
可 靠 的 准则 推导 出 新 的 论断 (事实 )。 例 如 ， 逻 辑 学 中 著名 的 推导 原则 如 下 : 


Te A 8. BB) na. (3B. Le}, Then tA ise1 


将 此 原则 应 用 于 下 面 的 事实 : 


事实 1: Socrates is a human 一 A isB 
事实 2: A human is mortal 一 B isC 


我 们 可 以 推导 出 下 面 的 事实 : 

事实 3; Socrates is mortal 一 有 RisC 

程序 员 需 要 学 习 有 关 主 题 领 域 的 知识 (知道 该 领域 内 的 所 有 已 知 的 事实 ) 或 是 向 该 领域 
的 专家 获取 事实 。 程 序 员 还 应 该 精通 如 何人 逻辑 上 严谨 地 定义 准则 。 这 样 程序 才能 推导 并 产生 


新 的 事实 。 
声明 性 语言 也 有 自身 的 缺 恨 ， 那 就 是 有 关 特 殊 领 域 的 程序 由 于 要 收集 大 量 的 事实 信息 


而 变 得 非常 斋 大 。 这 也 是 说 明 性 程序 迄今 为 止 只 局 限于 人 工 智 能 等 领域 的 原因 。 我 们 将 在 第 
18 章 进一步 讨论 逻辑 。 

Prolog 

最 著名 的 声明 性 语言 是 Prolog (PROgramming in LOGic)， 它 是 由 法 国人 A. Colmerauer 


于 1972 年 设计 开发 的 。Prolog 中 的 程序 全 部 由 事实 和 规则 组 成 。 例 如 ， 关 于 人 类 最 初 事 实 
可 陈述 如 下 : 


human (John) 
mortal (human) 


用 户 可 以 进行 询问 : 
? -mortal ( John ) 


程序 会 啊 应 yeso 


9.4 共同 概念 
在 这 一 节 ， 我 们 通过 对 一 些 过 程式 语言 的 快速 浏览 ， 发 现 共 同 的 概念 。 这 些 概念 中 的 一 
些 对 大 多 数 面向 对 象 语言 也 适用 ， 这 是 因为 当 创建 方法 时 面向 对 象 模式 使 用 过 程式 模式 。 


9.4.1 标识 符 

所 有 计算 机 语言 的 共同 特点 之 一 就 是 都 具有 标识 符 ， 即 对 象 的 名 称 。 标 识 符 允许 给 程序 
中 对 象 命名 。 例 如 ， 计 算 机 中 每 一 个 数据 都 存储 在 一 个 唯一 的 地 址 中 。 如 果 没 有 标识 符 来 符 
号 化 代表 数据 的 位 置 ， 你 就 不 得 不 去 了 解 并 直接 使 用 数据 的 地 址 来 操纵 它们 。 取 而 代 之 ， 只 
要 简单 给 出 数据 的 名 字 就 可 以 让 编译 器 去 跟踪 数据 实际 存放 的 物理 地 址 。 


9.4.2 ”数据 类 型 
数据 类 型 定义 了 一 系列 值 及 应 用 于 这 些 值 的 一 系列 操作 。 每 种 数据 类 型 值 的 集合 称 为 数 
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据 类 型 的 域 。 大 多 数 语 言 都 定义 了 两 类 数据 类 型 : 简单 数据 类 型 和 复合 数据 类 型 。 


1. 简单 数据 类 型 
简单 数据 类 型 (有 时 称 为 原子 类 型 、 基 本 类 型 、 标 量 类 型 或 内 建 类 型 ) 是 不 能 分 解 成 更 


小 数据 类 型 的 数据 类 型 。 强 制 性 语言 已 经 定义 一 些 简单 数据 类 型 : 
。 整数 类 型 是 不 包括 小 数 部 分 的 完整 的 数 。 整 数 的 取 值 范围 依赖 于 语言 。 有 些 语 言 文 持 
多 种 整数 大 小 。 
。 实数 类 型 是 带 小 数 部 分 的 数字 。 
。 字符 类 型 是 被 语言 使 用 的 潜在 字符 集中 的 符号 ， 例如，ASCII 或 Unicode。 
。 布尔 类 型 是 只 取 两 个 值 ( 真 或 假 ) 的 数据 类 型 。 


2. 复合 数据 类 型 
复合 数据 类 型 是 一 组 元 素 ， 其 中 每 个 元 素 都 是 简单 数据 类 型 或 复合 数据 类 型 (这 是 递归 


定义 )。 大 多 数 语言 定义 了 如 下 的 复合 数据 类 型 : 
。 数组 是 一 组 元 素 ， 其 中 每 个 元 素 具 有 相同 类 型 。 
。 记录 是 一 组 元 素 ， 其 中 的 元 素 可 以 具有 不 同 的 类 型 。 


9.4.3 变量 

变量 是 存储 单元 的 名 字 。 如 第 5 章 讨论 过 的 ， 每 个 内 存单 元 在 计算 机 中 都 有 一 个 地 址 。 
虽然 计算 机 内 部 使 用 地 址 ， 但 对 程序 员 而 言 却 十 分 不 方便 ， 首 先 ， 程 序 员 不 知道 内 存 中 数据 
项 的 相对 地 址 。 其 次 ， 数 据 项 在 内 存 中 可 能 占据 多 个 地 址 。 名 字 【〈 作 为 地 址 的 替代 ) 使 程序 
员 解 放出 来 ， 只 需 在 程序 如 何 执行 的 层次 上 考虑 。 程 序 员 可 以 使 用 一 个 变量 ，( 如 score) 来 
保存 测试 中 得 到 的 整 型 数值 。 既 然 变量 含有 一 个 数据 项 ， 那 它 就 有 类 型 。 


1. 变量 声明 
大 多 数 过 程式 语言 和 面向 对 象 语言 要 求 变量 在 使 用 前 被 声明 。 声 明 警 告 计算 机 被 赋予 名 


字 和 类 型 的 变量 将 在 程序 中 使 用 。 计 算 机 预 留 出 要 求 的 存储 区 域 ， 并 命名 它 。 我 们 在 前 一 节 
讨论 过 ， 声 明 是 对 象 创建 的 一 部 分 。 例 如 ,在 C、C++ 和 Java 中， 我 们 可 以 定义 三 种 变量 
数据 类 型 一 一 字符 、 整 数 和 实数 ， 它 们 显示 如 下 : 


char CC; 
int num; 
double result; 


第 一 行 声明 了 一 个 具有 字符 类 型 的 变量 C; 第 二 行 声明 整数 类 型 变量 num; 第 三 行 声明 
实数 类 型 变量 result。 


2. 变量 初始 化 
虽然 存储 在 变量 中 的 数据 值 在 程序 执行 过 程 中 可 能 改变 ,但 大 多 数 过 程式 语言 允许 变量 


在 它 声明 时 进行 初始 化 。 初 始 化 就 是 在 变量 中 存储 一 个 值 。 下 面 显 示 了 变量 如 何 同时 被 声明 
和 初始 化 。 


char C="'2'? 
int num=123; 
double result=256,782; 


9.4.4 字面 值 
字面 值 是 程序 中 使 用 的 预定 义 的 值 。 例 如 ， 当 半径 存储 在 变量 + 中 ， 需 要 计算 圆 的 面积 
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时 ， 可 以 使 用 表达 式 3.14 x*， 其 中 7(pi) 的 近似 值 就 是 被 用 作 字面 值 。 在 大 多 数 程序 设计 
语言 中 ， 可 以 有 整数 、 实 数 、 字 符 和 布尔 字面 值 ， 还 可 以 有 字符 串 字 面值 。 为 了 把 字符 和 
字符 串 字 面值 从 变量 名 和 其 他 对 象 中 区 分 开 ， 大 多 数 语 言 要 求 字符 字面 值 被 括 在 单 引号 中 ， 
如 'A'， 而 字符 串 字 面值 被 括 中 双 引 号 中 ， 如 "Anne"。 


9.4.5 ”常量 

字面 值 被 看 作 一 种 不 好 的 编程 实践 ， 除 非 我 们 能 确信 字面 值 的 值 将 不 会 随时 间 而 改变 (如 
几何 中 " 的 值 )。 但 是 ， 大 多 数字 面值 都 会 随时 间 而 改变 它 的 值 。 例 如 ， 销 售 税 今年 是 8%， 
明年 可 能 就 不 相同 。 当 我 们 写 程序 计算 事物 的 费用 时 ， 我 们 就 不 应 该 在 程序 中 使 用 字面 值 。 

cost + price X 1.08 

由 于 这 个 原因 ， 大 多 数 编程 语言 定义 常量 。 常 量 ( 像 变量 一 样 ) 是 一 个 可 以 存储 值 的 命 
名 的 位 置 。 但 值 在 程序 开始 处 被 定义 后 就 不 能 改变 。 但 是 ， 如 果 下 一 年 我 们 需要 再 次 使 用 这 
个 程序 ， 可 以 只 改变 程序 开始 处 的 一 行 : 常量 的 值 。 例 如 ， 在 C 或 C++ 程序 中 ， 税 率 能 在 
开始 处 被 定义 ， 而 在 程序 中 被 使 用 。 


const float taxMultiplier = 1.08; 


COst = price * taxMultiplier; 


注意 常量 ( 像 变 量 一 样 ) 有 类 型 。 当 常量 被 声明 时 ， 要 定义 它 的 类 型 。 


9.4.6 ”输入 和 输出 | 

几乎 所 有 的 程序 都 需要 输入 和 (或) 输出 数据 。 这 些 操作 将 比较 复杂 ， 尤 其 是 对 大 的 文 
件 进行 操作 时 。 大 多 数 程 序 设计 语言 使 用 一 些 预先 定义 好 的 函数 完成 输入 和 输出 。 

1. 输入 

数据 或 通过 语句 ， 或 通过 预先 定义 的 函数 来 完成 输入 。C 语言 有 几 个 输入 函数 。 例 如 ， 
scanf 函数 用 来 从 键盘 读 取 数 据 并 格式 化 ， 把 它 存储 在 一 个 变量 中 。 下 面 是 一 个 例子 ; 

scanf ("%d", gnum); 

当 程 序 遇 到 该 函数 指令 时 ， 程 序 等 待 用 户 输入 一 个 整数 。 然 后 将 这 个 值 存储 在 变量 num 
中 。%d 告诉 用 户 程序 需要 一 个 整 型 数值 。 

2. 输出 

数据 或 通过 语句 ， 或 通过 预先 定义 的 函数 来 完成 输出 。C 语言 有 几 个 输出 函数 。 例 如 ， 
printf 函数 能 够 在 显示 器 上 输出 一 个 字符 串 。 程 序 员 可 以 将 一 个 或 几 个 变量 变 为 字符 串 的 一 
部 分 。 下 面 的 语句 表示 在 文本 字符 串 的 末尾 显示 一 个 变量 的 值 。 


printf ("The value of the number is : %d" , num) ; 


9.4.7 表达 式 
表达 式 是 由 一 系列 操作 数 和 运算 符 简化 后 的 一 个 单一 数值 。 例 如 ， 下 面 是 一 个 值 为 13 
的 表达 式 : 


" 光 /本 
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1. 运算 符 
运算 符 是 用 来 完成 一 个 动作 的 特定 语言 的 语法 记号 。 最 为 熟悉 的 一 些 运算 符 都 是 从 数学 


中 得 到 的 。 例 如 ， 乘 法 (*) 是 一 个 运算 符 ， 表 示 两 个 数 相 乘 。 每 一 种 语言 都 有 运算 符 ， 并 


且 它 们 在 语法 或 规则 等 方面 的 使 用 是 严格 定义 的 。 
算术 运算 符 被 用 在 大 多 数 语 言 中 。 表 9-3 显示 了 一 些 用 于 C、C++ 和 Java 中 的 算术 运算 符 。 


表 9-3 算术 运算 符 
于 和 和 避 
2 
Smo 
+ Cat 
ee 


关系 运算 符 用 于 比较 两 个 数据 的 大 小 关系 。 关 系 运算 符 的 结果 是 逻辑 值 (true 或 false)。 
C、C++ 和 Java 语言 使 用 6 种 关系 运算 符 ， 如 表 9-4 所 示 。 


表 9-4 关系 运算 符 
运 算 符 例子 
< Num 
: Nom 
= Num Nam 
!= 不 等 于 NumllI=Num2 


逻辑 运算 符 是 迎 辑 值 (true 或 false) 组 合 后 得 到 的 一 个 新 值 。C 语言 使 用 如 表 9-5 所 示 
的 3 种 逻辑 运算 符 。 


表 9-5 有 远 辑 运算 符 
所 下 地 
i 
&& (Numl<5)&&(Num2>10) 
| | Neml<)Num2>10) 


2. 操作 数 
操作 数 接收 一 个 运算 符 的 动作 。 对 于 任何 一 个 运算 符 可 能 有 1、2 或 更 多 个 操作 数 。 举 


个 算术 的 例子 ， 除 法 运算 的 操作 数 是 被 除数 和 除数 。 


9.4.8 语句 


每 条 语句 都 使 程序 执行 一 个 相应 动作 。 它 被 直接 翻译 成 一 条 或 多 条 计算 机 可 执行 的 指 
令 。 例 如 ，C、C++ 和 Java 定义 了 许多 类 型 的 语句 。 在 本 节 中 我 们 将 对 其 中 一 些 加 以 讨论 。 
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1. 赋值 语句 
赋值 语句 给 变量 赋值 。 换 言 之 ， 它 存储 一 个 值 在 变量 中 ， 该 变量 是 在 声明 部 分 已 经 被 创 
建 的 。 在 我 们 的 算法 中 ， 使 用 符号 “<-” 定 义 赋值 。 大 多 数 语言 ( 像 C、C++ 和 Java) 使 用 
“= ”来 赋值 。 其 他 语言 ( 像 Ada 或 Pascal) 使 用 “:=” 来 赋值 。 
2. 复合 语句 | 
复合 语句 是 一 个 包含 0 个 或 多 个 语句 的 代码 单元 。 它 也 被 称 为 块 。 复 合 语句 使 得 一 组 语 
句 成 为 一 个 整体 。 复 合 语句 一 般 包括 一 个 左 大 括号 、 一 个 可 选 语句 段 以 及 一 个 右 大 括号 。 下 
面 是 一 个 复合 语句 的 例子 。 
{ 
= 1 :; 
“20 } 
) 
3. 控制 语句 
控制 语句 是 语句 的 集合 ， 它 在 过 程式 语言 中 作为 一 个 程序 执行 。 语 句 通 常 是 一 句 接 一 名 
被 执行 的 。 但 是 ， 有 了 时 需要 改变 这 种 顺序 的 执行 。 例 如 ， 去 重复 一 句 或 一 组 语句 ， 两 组 语句 
的 执行 依赖 于 布尔 值 。 在 计算 机 机 器 语言 中 ， 为 这 种 背离 顺序 执行 所 提供 的 指令 称 为 jump 
指令 ， 这 在 第 5 章 简要 讨论 过 。 早 期 的 强制 性 语言 使 用 go to 语句 来 模拟 jump 指令 。 虽 然 
如 今 go to 还 能 在 一 些 强制 性 语言 中 看 到 ， 但 结构 化 编程 原则 不 倡导 使 用 它 。 相 反 ， 结 构 化 
编程 强烈 推荐 使 用 三 种 结构 顺序、 选择 和 循环 ， 正 如 我 们 在 第 8 章 中 讨论 的 。 强 制 性 语言 
中 的 控制 语句 与 选择 和 循环 有 关 。 
。 大 多 数 强制 性 语言 都 有 两 路 和 多 路 选择 语句 。 两 路 选择 通过 if-else 语句 取得 ; 多 路 选 
择 通过 switch (或 case) 语句 取得 。 图 9-9 显示 了 if-else 语句 的 UML 图 和 代码 。 在 
if-else 语句 中 ， 如 果 条 件 为 真 ， 语 句 1 被 执行 ， 而 如 果 条 件 为 假 ， 语 句 2 被 执行 。 语 
句 1 和 语句 2 都 可 以 是 任何 类 型 的 语句 ， 包 括 空 语 句 或 复合 语句 。 图 9-9 还 显示 了 
switch (或 case) 语句 的 代码 。C 的 值 决定 了 语句 1、 语 句 2 或 语句 3 中 哪 一 个 被 执行 。 







EE (C) 





case a: 语句 1; break:; 
case b: 语句 2; break; 
case c: 语句 3; break; 






图 9-9 两 路 和 多 路 判断 
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。 我 们 在 第 8 章 讨 论 过 循环 结构 。 大 多 数 强制 性 语言 都 定义 了 1 一 3 个 能 实现 循环 的 循 
环 语句 。C、C++ 和 Java 定义 了 3 个 循环 语句 ， 但 它们 都 可 以 使 用 while 循环 来 模拟 
(图 9-10 )。 





do 
语句 
while (条 件 ); 


代码 





图 9-10 3 种 类 型 的 循环 


C 语言 中 主要 的 重复 语句 是 while 循环 。while 循环 是 一 个 预先 检查 的 循环 ， 它 检查 测 
试 表达 式 的 值 。 如 果 值 为 真 ， 则 进入 循环 迭代 一 次 ， 然 后 再 检测 。while 循环 被 认为 是 事件 
控制 循环 。 循 环 将 一 直 持 续 到 一 个 事件 发 生 ， 即 将 被 测 表 达 式 的 值 从 真 变 为 假 。 

for 循环 同样 也 是 一 个 先 测试 循环 。 但 是 与 while 循环 不 同 的 是 ， 它 是 一 个 计数 器 控制 
循环 ， 计 数 器 被 初始 化 为 一 个 初 值 ， 然 后 在 每 一 次 迭代 中 增加 (或 减少 )。 当 计数 器 的 值 达 
到 预定 值 时 循环 终止 。 

do-while 循环 也 是 一 个 事件 控制 循环 ,但 是 与 while 循环 不 同 的 是 ， 它 是 一 个 后 测试 循 
环 。 循 环 进行 一 次 迭代 后 ， 测 试 表达 式 的 值 。 如 果 是 假 ， 则 终止 。 如 果 是 真 ， 就 再 进行 一 次 


循环 而 后 表 测 试 。 


9.4.9 子 程序 


第 8 章 介 绍 过 选择 排序 算法 可 以 写成 一 个 主 程序 和 一 个 子 程序 。 所 有 需要 在 未 排序 列 
表 中 找 出 最 小 数据 项 的 过 程 都 可 以 聚合 成 一 个 子 程序 。 子 程序 的 概念 在 过 程式 语言 中 极其 重 
要 ,在 面向 对 象 语言 中 的 作用 要 少 些 。 前 面 解释 过 用 过 程式 语言 写 的 程序 通常 是 预先 定义 的 
一 组 过 程 ， 如 加 法 、 乘 法 等 。 但 是 ， 有 时， 那些 完成 单一 任务 的 这 些 过 程 的 子 集 能 集合 在 一 
起 ， 放 在 它们 自己 的 程序 单元 中 ， 也 就 是 子 程序 。 因 为 子 程序 使 程序 变 得 更 结构 化 ， 所 以 这 
是 非常 有 用 的 。 完 成 特定 任务 的 子 程序 能 一 次 编写 ， 多 次 调用 。 就 像 在 编程 语言 中 的 预定 义 
过 程 一 样 。 

子 程序 也 能 使 程序 更 容易 。 在 增 量 程序 开发 中 ， 程 序 员 可 以 通过 在 每 一 步 增加 一 个 子 程 
序 一 步 步 测 试 程序 。 在 编写 下 一 个 子 程序 前 进行 测试 ， 这 能 帮助 检查 错误 。 图 9-11 说 明了 


子 程序 的 概念 。 
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1. 局 部 变量 

在 过 程式 语言 中 ， 就 像 主 程序 一 样 ， 子 程序 能 调用 预定 义 
的 过 程 ， 在 局 部 对 象 上 操作 。 当 子 程序 每 次 被 调用 时 ， 这 些 局 
部 对 象 或 局 部 变量 被 创建 ， 当 控制 从 子 程序 返回 时 被 销毁 。 局 
部 对 象 属于 子 程序 。 

2. 参数 3 

子 程序 仅仅 作用 于 局 部 变量 是 非常 少见 的 。 大 多 数 时 候 主 
程序 需要 子 程序 作用 于 由 主 程序 创建 的 一 个 对 象 或 一 组 对 象 。 ”图 9-11 子 程序 的 概念 
在 这 种 情况 下 ， 程 序 和 子 程序 使 用 参数 。 在 主 程序 中 称 为 实际 参数 ， 在 子 程序 中 称 为 形式 参 
数 。 程 序 可 以 通过 下 列 两 种 方法 之 一 来 给 予 程序 传递 参数 ， 

。 传 值 

。 传 引用 

下 面 解 释 它们 。 


传 什 
在 传 值 参数 中 ， 主 程序 和 子 程序 创建 两 个 不 同 的 对 象 (变量 ) 。 在 程序 中 创建 的 对 象 属 


于 程序 ; 在 子 程序 中 创建 的 对 象 属于 子 程序 。 因 为 作用 域 不 同 ， 所 以 相应 的 对 象 可 以 有 相同 
的 名 字 或 不 同 的 名 字 。 主 程序 和 子 程序 的 通信 和 是 单方 向 的 ， 从 主 程序 到 子 程序 。 主 程序 传递 
Sy 存储 到 子 程序 中 相应 的 形式 参数 中 。 从 子 程 序 到 主 程序 没有 参数 的 通信 。 

| 9-1 假定 子 程序 是 为 主 程序 完成 打印 的 。 当 每 次 主 程序 需要 打印 值 时 ， 它 把 值 传 
省 给 予 程序 并 打 邱 出 来 。 主 程序 有 它 自 己 的 变量 X， 子 程序 也 有 它 自己 的 变量 A。 从 主 程序 
传递 给 子 程序 的 是 变量 X 的 值 。 这 个 值 被 存储 在 子 程序 的 变量 A 中 ， 子 程序 随后 要 打印 它 


(图 9-12 )。 


子 程序 








X: 实际 参数 


PE 直人 
A Pe 
1 S60. 


人 1 





图 9-12 传 值 的 例子 


在 例 9-1 中 ， 既 然 主 程序 是 发 送 一 个 值 到 子 程序 ， 那 么 为 了 这 个 目的 就 不 需 
要 一 个 变量 ; 主 程序 可 以 仅 发 送 一 个 字面 值 给 子 程序 。 换 言 之 ， 主 程序 可 以 用 print(X) 或 
print(5) 调用 子 程序 。 

传 值 在 现实 生活 中 的 一 个 类 推 是 : 当 一 位 朋友 需要 借 或 读 一 本 你 写 的 有 价值 
的 书 。 因 为 书 是 珍贵 的 ， 或 可 能 已 售 完 ， 你 把 书 复印 了 一 份 ， 送 给 了 你 的 朋友 。 任 何 对 副本 
的 损坏 都 不 会 影响 你 的 书 。 

传 值 有 个 优点 : 子 程序 接收 的 仅仅 是 个 值 。 它 不 能 改变 (有 意 的 或 无 意 的 ) 主 程序 中 变 
量 的 值 。 但 是 ， 当 程序 实际 上 要 求 子 程序 这 样 做 时 ， 子 程序 不 能 改变 主 程序 中 变量 的 值 就 变 


成 了 缺点 。 
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假定 主 程序 有 两 个 变量 X 和， 需要 交换 它们 的 值 。 主 程序 调用 子 程序 swap 
来 完成 。 它 传递 X 和 Y 的 值 给 子 程序 ， 它们 被 存储 在 两 个 变量 A 和 B 中 。swap 子 程序 使 用 
局 部 变量 T (临时 )， 交 换 A 和 了 B 中 的 两 个 值 。 但 X 和 YY 中 的 原始 值 保 留 原样 : 它们 并 没有 
交换 。 在 图 9-13 中 说 明 这 些 。 





7 的 副本 被 传递 
5 的 副本 被 传递 





X 和 Y : 实际 参数 
A 和 B: 形式 参数 


图 9-13 传 值 不 起 作用 的 例子 


传 引用 

传 引用 被 设计 来 允许 子 程序 改变 主 程序 中 变量 的 值 。 在 传 引用 中 ， 变 量 (实际 上 它 是 内 
存 的 地 址 ) 被 主 程序 和 子 程序 共享 。 相 同 的 变量 可 能 在 主 程序 和 子 程序 中 有 不 同 的 名 字 , 但 
两 个 名 字 是 指向 同一 个 变量 。 我 们 可 以 形象 地 把 传 引用 看 成 是 有 两 个 门 的 盒子 ， 一 个 开 在 主 
程序 ; 另 一 个 开 在 子 程序 。 主 程序 可 以 把 值 留 在 盒子 里 给 子 程 序 ， 子 程序 可 以 改变 这 个 原始 
的 值 ， 并 留 个 新 值 给 主 程序 。 

如 果 使 用 同样 的 swap 子 程序 ， 但 让 变量 使 用 传 引 用 , X 和 YY 中 的 两 个 值 实 
际 上 被 交换 ， 如 图 9-14 所 示 。 


a A 
上 ey < 
vx tos 
Es 区 > 
矶 
_ 
-| 
" 


: SR Ht Pe a 
| af ¥ NA ~ ， : 
swap (RefX, RefY) A 3 rt wy i ) l 
i 4 Bl 
人 





X 和 Y: 实际 参数 
A 和 B: 形式 参数 
T: 局 部 ( 临时 ) 参数 


图 9-14 传 引用 的 例子 
3. 返回 值 


子 程序 可 以 被 设计 成 返回 一 个 值 或 几 个 值 。 这 是 预定 义 过 程 被 设计 的 方法 。 当 使 用 表达 
式 C 二 A+B 时 ， 实 际 上 调用 过 程 add(A, B)， 该 过 程 返 回 一 个 值 ， 并 存储 在 变量 C 中 。 
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4. 实现 


子 程序 概念 在 不 同 的 语言 中 被 不 同 地 实现 。 在 C 和 C++ 中 , 子 程序 被 实现 为 函数 。 


9.5 ” 章 末 材料 
推荐 读物 


有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书 籍 : 


® Cooke, D. A. Concise Introduction to Computer Languages, Pacfic Grove, CA: Brooks/ 


Cole, 2003 


。 Tucker, A, and Noonan, R. Programming Languages: Principles and Paradigms, Burr 


Ridge, IL: McGraw-Hill, 2002 


® Pratt, T. and Zelkowitz, M. Programming Languages, Design and Implementation, 


Englewood Cliffs, NJ: Prentice-Hall, 2001 


® Sebesta, R. Concepts of Programming Languages, Boston, MA: Addison-Wesley, 2006 


关键 术语 


actual parameter (实际 参数 ) 

Ada 

applet (小 程序 ) 

arithmetic operator (算术 运算 符 ) 

assembler (汇编 程序 ) ] 

assembly language (汇编 语言 ) 

assignment statement (赋值 语句 ) 

bytecode ( 字 节 码 ) 

C++ language (C++ 语言 ) 

C language (C 语言 ) 

class (类 ) 

code generator (代码 生成 器 ) 

COmmon Business-Oriented Language 
(COBOL 语言 ) 

compilation (编译 ) 

complier (编译 器 ) 

composite type (复合 类 型 ) 

compound statement (复合 语句 ) 

compnuter language (计算 机 语言 ) 

constant (常量 ) 

data type〔( 数 据 类 型 ) 

declarative language (声明 性 语言 ) 

declarative paradigm (声明 式 模式 ) 

expression (表达 式 ) 


formal parameter (形式 参数 ) 

FORmula TRANSslation (FORTRAN) 

functional language (函数 式 语言 ) 

functional paradigm (函数 式 模式 ) 

high-level language (高 级 语言 ) 

identifier (标识 符 ) 

imperative language (命令 式 语言 ) 

imperative paradigm (命令 式 模 式 ) 

inheritance (继承 ) 

input (输入 ) 

interpretation (解释 ) 

interpreter (解释 器 ) 

Java 

lexical analyzer (词法 分 析 器 ) 

LISt Programining Language (LISP， 表 处 理 
编程 语言 ) 

literal (字面 量 ) 

local variable (局 部 变量 ) 

logical operator (逻辑 运算 符 ) 

machine language (机 器 语言 ) 

method (方法 ) 

multithreading (多 线程 ) 

object-oriented language (面向 对 象 语言 ) 

object-oriented paradigm (面向 对 象 模式 ) 
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object program (目标 程序 ) Scheme 

operator (操作 数 ) semantic analyzer (语义 分 析 器 ) 
operator (运算 符 ) simple type (简单 类 型 ) 
output (输出) source program ( 源 程 序 ) 
parameter (参数 ) statement (语句 ) 

Pascal subprogram ( 子 程序 ) 

pass by reference ( 传 引 用 ) symbolic language (符号 语言 ) 
pass by value ( 传 值 ) syntax (语法 ) 

procedural paradigm (过 程式 模式 ) syntax analyzer (语法 分 析 严 ) 
Programming in LOGic (PROLOG ) token〈 助 记 符 ) 
programming language (编程 语言 ) translator ( 翻译 器 ) 

relational operator (关系 运算 符 ) variable (变量 ) 

小 结 


。 计算 机 语言 是 一 组 预定 义 的 单词 ， 按 照 预定 义 的 规则 (语言 的 语法 )， 这 些 单词 被 组 
合 进 一 个 程序 中 。 经 过 多 年 的 发 展 ， 计 算 机 语言 已 经 从 机 器 语言 演化 到 高 级 语言 。 计 
算 机 能 理解 的 唯一 语言 是 机 器 语言 。 
高 级 语言 对 许多 不 同 的 计算 机 是 轻便 的 ， 它 允许 程序 员 专 注 于 应 用 ， 而 不 是 计算 机 组 
织 的 复杂 性 。 
为 了 在 计算 机 上 人 允许 一 个 程序 ， 程 序 需要 被 翻译 成 计算 机 本 地 的 机 器 语言 。 高 级 语言 
程序 称 为 源 程序 。 翻 译 过 来 的 机 器 语言 程序 称 为 目标 程序 。 两 种 方法 被 用 来 翻译 : 编 
译 和 解释 。 编 译 器 把 整个 源 程序 翻译 成 目标 程序 ， 解 释 是 指 一 行 接 一 行 地 把 源 程序 的 
每 一 行 翻译 成 相应 目标 程序 行 ， 并 执行 它们 的 过 程 。 
翻译 过 程 使 用 词法 分 析 器 、 语 法 分 析 器 、 语 义 分 析 器 和 代码 生成 器 来 产生 助 记 符 表 。 
模式 描述 了 计算 机 语言 被 用 来 处 理 要 解决 问题 的 方法 。 我 们 把 计算 机 语言 分 成 4 种 模 
式 : 过 程式 、 面 向 对 象 、 函 教 式 和 声明 式 。 过 程式 模式 把 程序 看 作 操作 被 动 对 象 的 活 
动 对 象 。FORTRAN、COBOL、Pascal、C 和 Ada 都 是 过 程式 语言 的 例子 。 面 向 对 象 
模式 处 理 活 动 对 象 ， 而 不 是 被 动 对 象 。C++ 和 Java 是 常见 的 面向 对 象 语言 。 在 函数 
式 模 式 中 ， 程 序 被 看 作 数 学 函数 。 在 上 下 文中 ， 函 数 是 把 一 组 输入 映射 到 一 组 输出 的 
黑 盒子 。LISP 和 Scheme 是 常见 的 函数 式 语言 。 声 明 式 模式 使 用 逻辑 推理 原则 来 回答 
问题 。 一 个 最 有 名 的 声明 式 语言 是 PROLOG。 
。 在 过 程式 和 面向 对 象 语言 中 的 一 些 常 见 概念 有 : 标识 符 、 数 据 类 型 、 变 量 、 字 面值 、 
常量 、 输 入 和 输出 、 表 达 式 和 语句 。 大 多 数 语言 使 用 两 类 控制 语句 : 判断 和 循环 。 子 
程序 是 过 程式 语言 间 的 共同 概念 。 


9.6 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建 议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 
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复习 题 


Q9-1 汇编 语言 与 机 器 语言 有 哪些 区 别 ? 

Q9-2 汇编 语言 与 高 级 语言 有 哪些 区 别 ? 

Q9-3 ” 哪 种 计算 机 语言 与 计算 机 直接 相关 ， 并 被 计算 机 理解 ? 

Q9-4 区 分 编译 和 解释 。 

Q9-5 列 出 编程 语言 翻译 中 的 4 个 步骤 。 

Q9-6 列 出 4 种 常见 的 计算 机 语言 模式 。 

Q9-7 ”比较 和 对 照 过 程式 模式 与 面向 对 象 模式 。 

Q9-8 ”定义 面向 对 象 语言 中 的 类 和 方法 ， 这 两 个 概念 间 的 联系 是 什么 ?它们 与 对 象 概念 间 的 联系 又 是 
什么 ? 

Q9-9 ”定义 函数 式 模式 。 

Q9-10 ”定义 声明 式 模式 。 


练习 题 


P9-1 声明 C 语言 中 的 三 个 整 型 变量 。 

P9-2 声明 C 语言 中 的 三 个 实数 变量 ， 用 三 个 值 初始 化 它们 。 
P9-3 声明 C 语言 中 分 别 为 字符 型 、 整 型 和 实数 的 三 个 常量 。 
P9-4 解释 为 什么 常量 必须 在 声明 时 进行 初始 化 。 

P9-5 找 出 下 列 C 语言 代码 段 中 statement 被 执行 的 次 数 。 


A=5 
while (A<8) 
{ 
statement; 
A=A+ 2; 
} 


P9-6 找 出 下 列 C 语言 代码 段 中 statement 被 执行 的 次 数 。 


A=5 

while (A<8) 

{ 
statement; 
A=A-2; 

} 


P9-7 找 出 下 列 C 语 言 代码 段 中 statement 被 执行 的 次 数 。 


for (int i=5; i<20; i++) 
{ 

statement; 

i=i+1; 
} 


P9-8 找 出 下 列 C 语言 代码 段 中 statement 被 执行 的 次 数 。 


A=5 
do 
{ 
statement; 
号 本 :用 二 7 
} while(R<10) 
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P9-9 
P9-10 
P9-11 
P9-12 
P9-13 
P9-14 
P9-15 
P9-16 
P9-17 
P9-18 
P9-19 
P9-20 


P9-21 


P9-22 


P9-23 
P9-24 
P9-25 
P9-26 


P9-27 
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用 do-while 循环 写 出 练习 P9-6 中 的 代码 。 


用 do-while 循环 写 出 练习 P9-7 中 的 代码 。 

用 while 循环 写 出 练习 P9-7 中 的 代码 。 

用 for 循环 写 出 练习 P9-8 中 的 代码 。 

用 for 循环 写 出 练习 P9-6 中 的 代码 。 

用 while 循环 写 出 一 个 从 不 执行 它 的 循环 体 的 代码 段 。 
用 do 循环 写 出 一 个 从 不 执行 它 的 循环 体 的 代码 段 。 
用 for 循环 写 出 一 个 从 不 执行 它 的 循环 体 的 代码 段 。 
用 while 循环 写 出 一 个 永 不 停止 的 代码 段 。 

用 do 循环 写 出 一 个 永 不 停止 的 代码 段 。 

用 for 循环 写 出 一 个 永 不 停止 的 代码 段 。 

在 下 列 代 码 中 ， 找 到 所 有 的 字面 值 : 


C=12*A+4* (B-5) 
在 下 列 代 码 中 ， 找 到 变量 和 字面 值 : 


Hello="Hello"; 
用 switch 语句 改写 下 列 代码 段 : 


if (A==4) 
| 
statementl1; 
} 
else if(A==6) 
{ 


statement2; 


} 
else if (A==8) 
{ 


statement3; 


} 


else 


{ 


statement4d; 


} 
如 果子 程序 calculate(A, B, S, 了 ) 接收 A 和 B 的 值 ， 计 算 它 们 的 和 S 与 乘积 P， 哪 个 变量 要 用 
传 值 ? 哪个 变量 需要 用 传 引用 ? 

如 果子 程序 smaller(A, B, S) 接收 A 和 B 的 值 ， 找 出 两 个 中 较 小 的 ， 哪 个 变量 要 用 传 值 ? 哪个 
变量 需要 用 传 引 用 ? 

如 果子 程序 cube(A) 接收 A 的 值 ， 计 算 它 的 立方 (A3 )， 给 A 传递 参数 时 是 用 传 值 还 是 用 传 
引用 ? 

如 果子 程序 需要 从 键盘 上 接收 A 的 值 ， 并 把 它 返回 给 主 程序 ， 给 A 传递 参数 时 是 用 传 值 还 是 
用 传 引用 ? 

如 果子 程序 需要 在 监视 器 上 显示 A 的 值 ， 给 A 传递 参数 时 是 用 传 值 还 是 用 传 引用 ? 
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软件 工程 


这 一 和 草 介 绍 软件 工程 的 概念 。 我 们 以 软件 生命 周期 为 起 点 ， 接 着 说 明 用 于 开发 过 程 的 两 
个 模型 : 瀑布 模型 和 增 量 模型 。 然 后 简要 讨论 开发 过 程 的 4 个 阶段 。 软 件 工程 是 建立 在 这 样 
的 基础 之 上 ， 即 利用 合理 的 工程 方法 和 原则 来 获得 在 真实 机 器 上 工作 的 可 靠 软件 。 这 个 定义 
出 目 1969 年 第 一 届 国 际 软件 工程 会 议 ， 恰 巧 是 第 一 台 计 算 机 诞生 30 年 之 际 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 理解 软件 工程 中 的 软件 生命 周期 的 概念 ; 

。 摘 述 两 种 主要 的 开发 过 程 模型 一 瀑布 模型 和 增 量 模型 ; 

。 理解 分 析 阶 段 ， 描述 在 分 析 阶段 两 种 独立 的 方法 一 面向 过 程 分 析 和 面向 对 象 分 析 

。 理解 设计 阶段 ， 描 述 在 设计 阶段 两 种 独立 的 方法 一 一 面向 过 程 设计 和 面向 对 象 设计 ; 

。 描述 实现 阶段 ,识别 该 阶段 中 的 质量 问题 ，; 

。 描述 测试 阶段 ， 区 分 白 盒 测试 和 黑 盒 测 试 ; 

。 识别 软件 工程 中 文档 的 重要 性 ， 区 分 用 户 文档 、 系 统 文档 和 技术 文档 。 


10.1 软件 生命 周期 

软件 生命 周期 是 软件 工程 中 的 一 个 基础 概念 。 软 件 和 其 他 的 产品 一 样 ， 周 期 性 地 重复 着 
一 些 阶段 (图 10-1 )。 

软件 最 初 由 开发 者 小 组 开发 。 通 常 ， 
在 它 需 要 修改 之 前 会 使 用 一 段 时 间 。 由 于 
软件 中 会 发 现 错误 、 设 计 改 变 规则 或 公司 
本 身 发 生变 化 ， 这 些 都 导致 需要 经 常 修改 
软件 。 为 长 久 使 用 考虑 软件 应 该 被 修改 。 
使 用 和 修改 ， 这 两 个 步骤 一 直 进行 下 去 直 
到 软件 过 时 。“ 过 时 ”意味 着 因 效 率 低下 、 
语言 过 时 、 用 户 需 求 的 重大 变化 或 其 他 因 
素 而 导致 软件 失去 它 的 有 效 性 。 人 


10.1.1 开发 过 程 模型 

虽然 软件 工程 涉及 图 10-1 中 的 所 有 三 个 过 程 ， 但 本 章 我 们 只 讨论 开发 过 程 ， 它 在 
图 10-1 中 处 于 循环 流程 之 外 。 在 软件 生命 周期 中 ， 开 发 过 程 包括 4 个 阶段 : 分 析 、 设 计 、 
实现 和 测试 。 开 发 过 程 有 多 种 模型 ， 这 里 我 们 讨论 最 常见 的 两 种 : 瀑布 模型 和 增 量 模型 。 

1. 瀑布 模型 

软件 开发 过 程 的 一 种 非常 流行 的 模型 就 是 众所周知 的 瀑布 模型 (图 10-2 ) 。 在 这 种 
模型 中 ， 开 发 过 程 只 有 一 个 方向 的 流动 。 这 意味 着 前 一 个 阶段 不 结束 ， 后 一 个 阶段 不 能 


开始 。 
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例如 ， 整 个 工程 的 分 析 阶 段 应 该 在 设计 阶段 开始 前 完成 。 整 个 设计 阶段 应 该 在 实现 阶段 
开始 前 完成 。 

瀑布 模型 既 有 优点 ， 也 有 缺点 。 优 点 之 一 就 是 
在 下 一 个 阶段 开始 前 每 个 阶段 已 经 完成 。 例 如 ， 在 
设计 阶段 的 小 组 能 准确 地 知道 他 们 要 做 什么 ， 因 为 
他 们 有 分 析 阶 段 的 完整 结果 。 测 试 阶段 能 测试 整个 
系统 ， 因 为 整个 系统 已 经 完成 。 但 是 ， 瀑 布 模型 的 er 各 放 全 二 
缺点 是 难以 定位 问题 ， 如 果 过 程 的 一 部 分 有 问题 ， sgt 
必须 检查 整个 过 程 。 

2. 增 量 模型 

在 增 量 模型 中 ， 软 件 的 开发 要 经 历 一 系列 步 又。 开发 者 首先 完成 整个 系统 的 一 个 简化 版 
本 ， 这 个 版 本 表示 了 整个 系统 ， 但 不 包括 具体 的 细节 。 图 10-3 显示 了 增 量 模型 的 概念 。 





时 间 





图 10-3 增 量 模型 


在 第 二 个 版 本 中 ， 更 多 的 细节 被 加 入 ;而 有 些 还 没完 成 ， 然 后 再 次 测试 系统 。 如 果 这 时 
有 问题 ， 开 发 者 知道 问题 出 于 新 功能 。 直 到 现 有 系统 工作 正确 后 ， 他 们 才 增 加 新 的 功能 。 这 
样 过 程 一 直 继续 下 去 ， 直 到 要 求 的 功能 全 部 被 加 入 。 


10.2 分 析 阶 段 

整个 开发 过 程 始 于 分 析 阶 段 ， 这 个 阶段 生成 规格 说 明文 档 ， 这 个 文档 说 明了 软件 要 做 什 
么 ， 而 没有 说 明 如 何 去 做 。 分 析 阶 段 可 以 使 用 两 种 独立 的 方法 ， 它 们 依赖 于 实现 阶段 使 用 的 
是 过 程 编程 语言 ， 还 是 面向 对 象 语言 。 本 节 简 单 地 讨论 这 两 种 方法 。 


10.2.1 面向 过 程 分 析 


如 果实 现 阶段 使 用 过 程式 语言 ， 那 么 面向 过 程 分 析 (也 称 为 结构 化 分 析 或 经 典 分 析 ) 就 
是 分 析 阶 段 使 用 的 方法 。 这 种 情况 下 的 规格 说 明 可 以 使 用 多 种 建 模 工具 ， 但 我 们 只 讨论 其 中 
少数 几 个 。 

1. 数据 流 图 

数据 流 图 显示 了 系统 中 数据 的 流动 。 它 们 使 用 4 种 符号 : 方形 盒 表 示 数 据 源 或 数据 目 
的 ， 带 圆 角 的 和 矩形 表示 过 程 (数据 上 的 动作 )。 末 端 开口 的 矩形 表示 数据 存储 的 地 方 ， 箭 头 
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图 10-4 显示 了 一 个 小 旅馆 中 预订 系统 的 简单 版 本 ， 它 接收 潜在 客户 通过 因特网 的 预订 ， 


根据 房间 是 否 空闲 确认 或 拒绝 预订 。 





图 10-4 数据 流 图 的 一 个 例子 


这 个 图 中 的 过 程 之 一 (处理 预订 ) 就 是 使 用 预订 文件 ， 接 受 或 拒绝 预订 。 如 果 预 订 被 接 
受 ， 它 将 被 记录 在 预订 文件 中 。 

2. 实体 关系 图 

分 析 阶 段 使 用 的 另 一 个 建 模 工 具 是 实体 关系 图 。 因 为 这 个 图 也 用 于 数据 库 的 设计 ， 所 以 
我 们 将 在 14 章 中 讨论 它 。 

3. 状态 图 

状态 图 (参见 附录 B) 提供 了 另外 一 种 有 用 的 工具 ， 它 通常 用 于 当 系 统 中 的 实体 状态 在 
响应 事件 时 将 会 改变 的 情况 下 。 作 为 状态 图 的 一 个 例子 ， 我 们 显示 了 单 人 电梯 的 操作 。 当 楼 
层 按钮 被 按时 ， 电 梯 将 按 要 求 的 方向 移动 ， 在 到 达 目 的 地 之 前 ， 它 不 会 响应 其 他 任何 请 求 。 

图 10-5 显示 了 该 老式 电梯 的 状态 图 。 电 梯 可 以 是 三 种 状态 的 一 种 : 上 升 、 下 降 或 停止。 
每 种 状态 在 状态 图 中 用 圆 角 矩形 表示 。 当 电梯 处 在 停止 状态 时 ， 它 接受 请 求 。 如 果 请 求 的 楼 
层 与 当前 的 楼 层 相 同 ， 那 请 求 被 忽略 ， 电 梯 保 持 停止 状态 ; 如 果 请 求 的 楼 层 高 于 当前 楼 层 ， 
电梯 开始 上 升 ; 如 果 请 求 的 楼 层 低 于 当前 楼 层 ， 电 梯 开始 下 降 。 一 旦 开始 移动 ， 电 梯 将 一 直 
保持 在 一 种 移动 状态 中 ， 直 至 到 达 请 求 的 楼 层 。 


RF; 请 求 的 楼 层 
CF: 当前 楼 层 





图 10-5 ”状态 图 的 一 个 例子 


10.2.2 面向 对 象 分 析 


如 果实 现 使 用 面向 对 象 语言 ， 那 么 面向 对 象 分 析 就 是 分 析 过 程 使 用 的 。 这 种 情况 下 的 规 
格 说 明文 档 可 以 使 用 多 种 工具 ， 但 我 们 只 讨论 其 中 少数 几 种 。 
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1. 用 例 图 
用 例 图 给 出 了 系统 的 用 户 视图 : 它 显示 了 用 户 与 系统 间 的 交互 。 用 例 图 使 用 4 种 组 件 : 


系统 、 用 例 、 动 作者 和 关系 。 系 统 ( 用 和 矩形 表示 ) 执行 功能 。 系 统 中 的 行动 由 用 例 显 示 ， 它 
用 圆 角 的 矩形 表示 。 动 作者 是 使 用 系统 的 某 人 或 某 事 。 虽 然 动 作者 用 线条 人 物 来 表示 ， 但 它 
们 并 不 需要 表示 人 类 。 

图 10-6 显示 老式 电梯 的 用 例 图 ， 在 图 10-5 中 已 经 显示 了 它 的 状态 图 。 这 个 图 中 的 系统 
是 电梯 。 唯 一 的 动作 者 是 电梯 的 使 用 者 。 这 里 有 两 个 用 例 : 按 电梯 按钮 (在 每 层 的 大 厅 ) 和 
在 电梯 内 按 楼 层 按钮 。 电 梯 在 每 层 只 有 一 个 按钮 ， 它 给 电梯 移 到 该 层 的 信号 。 


2. 类 图 

分 析 的 下 一 步 就 是 创建 系统 的 类 图 。 例 如 ， 我 们 可 以 为 老式 电梯 创建 类 图 。 为 了 做 这 
些 ， 我 们 需要 考虑 系统 涉及 的 实体 。 在 电梯 系统 中 ， 有 两 个 实体 类 : 按钮 和 电梯 本 身 。 但 
是 ， 有 两 种 不 同类 型 的 按钮 :在 走廊 里 的 电梯 按钮 和 在 电梯 里 的 楼 层 按钮 。 那 么 这 似乎 是 我 
们 有 一 个 按钮 的 类 和 从 该 按钮 类 继承 的 两 个 类 : 电梯 按钮 类 和 楼 层 按钮 类 。 图 10-7 显示 了 


我 们 为 电梯 问题 创建 的 第 一 个 类 图 。 


~ Wy 
er 
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图 10-6 用例 图 的 一 个 例子 图 10-7 类 图 的 一 个 例子 


注意 ; 电梯 按钮 类 和 楼 层 按钮 类 是 按钮 类 的 子 类 。 但 是 ， 电 梯 类 与 两 个 按钮 类 (电梯 按 
钮 和 楼 层 按钮 ) 间 的 关系 是 一 对 多 关系 (参见 附录 B)。 电 梯 系 统 的 类 图 当然 是 可 以 扩展 的 ， 
但 我 们 把 这 个 留 给 软件 工程 方面 的 书 。 


3. 状态 图 
类 图 完成 之 后 ， 就 可 以 为 类 图 中 的 每 个 类 准备 状态 图 。 面 向 对 象 分 析 中 的 状态 图 与 面向 


过 程 分 析 中 的 状态 图 起 相同 作用 。 这 意味 着 对 于 图 10-7 中 的 类 图 ， 我 们 需要 一 个 有 4 个 状 
态 的 图 。 


10.3 设计 阶段 

设计 阶段 定义 系统 如 何 完成 在 分 析 阶 段 所 定义 的 需求 。 在 设计 阶段 ， 系 统 所 有 的 组 成 部 
分 都 被 定义 。 
10.3.1 面向 过 程 设计 

在 面向 过 程 设计 中 ， 我 们 既 要 设计 过 程 ， 也 要 设计 数据 。 我 们 讨论 一 类 注重 过 程 的 设计 
方法 。 在 面向 过 程 设 计 中 ， 整 个 系统 被 分 解 成 一 组 过 程 或 模块 。 


1. 结构 图 
在 面向 过 程 设 计 中 ,说明 模 块 间 关系 的 常用 工具 是 结构 图 。 例 如 ， 图 10-5 显示 的 状态 
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图 的 电梯 系统 可 以 设计 成 一 组 模块 ， 这 些 模块 显示 在 图 10-8 中 的 结构 图 中 。 结 构图 将 在 附 
录 了 中 讨论 。 

2, 模块 化 

模块 化 意味 着 将 大 项 目 分 解 成 较 小 的 部 分 ， 以 
便 能 够 容易 理解 和 处 理 。 换 言 之 ， 模 块 化 意味 着 将 
大 程序 分 解 成 能 互相 通信 的 小 程序 。 前 一 节 讨 论 的 
结构 图 显示 了 电梯 系统 中 的 模块 化 。 当 系统 被 分 解 
成 模块 时 ， 主 要 关心 两 点 ; 耦 合 和 内 聚 。 

耦合 图 10-8 结构 图 

耦合 是 对 两 个 模块 互相 绑 定 紧密 程度 的 度量 。 越 
紧 耦 合 的 模块 ， 它 们 的 独立 性 越 差 。 既 然 目 标 是 为 了 让 模块 尽 可 能 地 独立 ， 你 需要 让 它们 松 
散 耦 合 。 至 少 有 三 条 理由 说 明 松 散 耦 合 是 希望 的 : 

。 松散 耦合 的 模块 更 可 能 被 重用 ; 

。 松散 耦合 的 模块 不 容易 在 相关 模块 中 产生 错误 ; 

。 当 系 统 需要 修改 时 ， 松 散 耦 合 的 模块 允许 我 们 只 修改 需要 改变 的 模块 ， 而 不 会 影响 到 

不 需要 改变 的 模块 。 


“软件 系统 中 模块 间 的 耦合 必须 最 小 化 。 


内 聚 
模块 化 的 另 一 个 问题 是 内 聚 。 内 聚 是 程序 中 处 理 过 程 相关 紧密 程度 的 度量 。 我 们 需要 尽 


可 能 最 大 化 软件 系统 模块 间 的 内 聚 。 
软件 系统 中 模块 间 的 内 聚 必须 最 大 化 。 





10.3.2 面向 对 象 设计 

在 面向 对 象 设 计 中 ， 设 计 阶 段 通过 详细 描述 类 的 细节 来 继续 。 就 像 第 9 章 提 到 的 ， 类 
是 由 一 组 变量 (属性 ) 和 一 组 方法 组 成 。 面 向 对 象 设计 阶段 列 出 这 些 属 性 和 方法 的 细节 。 
图 10-9 显示 了 在 老式 电梯 设计 中 使 用 的 4 个 类 的 细节 。 





图 10-9 带 有 属性 和 方法 类 的 一 个 例子 


10.4 实现 阶段 

在 瀑布 模型 中 ， 设 计 阶 段 完成 之 后 ， 实 现 阶 段 就 可 以 开始 了 。 在 这 个 阶段 ， 程 序 员 为 
面向 过 程 设 计 中 的 模块 编写 程序 或 者 编写 程序 单元 ， 实现 面 向 对 象 设计 中 的 类 。 在 每 种 情况 
中 ， 都 有 一 些 我 们 需要 提 及 的 问题 。 
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10.4.1 语言 的 选择 

在 面向 过 程 开发 中 ， 工 程 团队 需要 从 第 9 章 所 讨论 的 面向 过 程 语言 中 选择 一 个 或 一 组 语 
言 。 虽 然 有 些 语言 ( 像 C++) 被 看 成 既是 面向 过 程 的 ， 又 是 面向 对 象 的 语言 ， 但 通常 实现 使 
用 纯 过 程 语 言 ， 如 C 语言 。 在 面向 对 象 的 情况 下 ，C++ 和 Java 的 使 用 都 很 普遍 。 


10.4.2 ”软件 质量 

在 实现 阶段 创建 的 软件 质量 是 一 个 非常 重要 的 问题 。 具 有 高 质量 的 软件 系统 是 一 个 能 满 
足 用 户 需 求 、 符 合 组 织 操 作 标 准 和 能 高 效 运 行 在 为 其 开发 的 硬件 上 的 一 个 软件 。 但 是 ， 如 果 
我 们 需要 取得 高 质量 的 软件 系统 ， 那 么 必须 能 定义 质量 的 一 些 属性 。 


软件 质量 因素 
软件 质量 能 够 划分 成 三 个 广义 的 度量 : 可 操作 性 、 可 维护 性 和 可 迁移 性 。 每 个 度量 如 


图 10-10 所 示 还 可 以 展开 。 





口 准确 性 口 可 变性 D 重用 性 
口 高 效 性 口 可 修正 性 D 互 用 性 
口 可 靠 性 口 适应 性 口 可 移植 性 
口 安全 口 可 测试 性 
口 及 时 性 
口 适用 性 

图 10-10 质量 因素 


可 操作 性 

可 操作 性 涉及 系统 的 基本 操作 。 就 像 图 10-10 中 显示 的 一 样 ， 可 操作 性 有 多 种 度量 方 
法 : 准确 性 、 高 效 性 、 可 靠 性 、 安 全 、 及 时 性 和 适用 性 。 

。 不 准确 的 系统 比 没 有 系统 更 糟糕 。 任 何 被 开发 的 系统 都 必须 经 过 系统 测试 工程 师 和 用 
户 检测 。 准 确 性 能 够 通过 诸如 故障 平均 时 间 、 每 千 行 代码 错误 数 以 及 用 户 请 求 变 更 数 
这 样 的 测量 指标 来 度量 。 
高 效 性 大 体 上 是 个 主观 的 术语 。 在 一 些 实例 中 ， 用 户 将 指定 性 能 指标 ， 例 如 实时 响应 
必须 在 1 秒 之 内 接收 到 ， 成 功率 在 95%。 它 显然 是 可 测量 的 。 
可 人 靠 性 实际 上 综合 了 其 他 各 种 因素 。 如 果 用 户 指 望 系 统 完 成 工作 并 对 其 有 信心 ， 这 时 
它 就 是 最 可 靠 的 。 另 外 ， 一 些 度量 直接 说 明了 系统 的 可 靠 性 ， 最 显著 的 是 故障 平均 
时 间 。 
一 个 系统 的 安全 性 是 以 未 经 授权 的 人 得 到 系统 数据 的 难 易 程度 为 参照 的 。 尽 管 这 是 个 
主观 的 领域 ， 但 仍然 有 可 核查 的 清单 帮助 评估 系统 的 安全 性 。 例 如 ， 系 统 有 并 且 需 要 
密码 来 验证 用 户 吗 ? 
在 软件 工程 中 ， 及 时 性 意味 着 几 件 不 同 的 事情 。 系 统 及 时 传递 它 的 输出 了 吗 ? 对 于 在 
线 系统 ， 响 应 时 间 满 足 用 户 的 需求 了 吗 ? 
。 适用 性 是 男 一 个 很 主观 的 领域 。 对 适用 性 的 最 好 度量 方法 是 观察 用 户 ， 看 他 们 是 如 何 
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正在 使 用 这 个 系统 的 。 用 户 访 谈 能 够 常常 发 现 系 统 适用 性 上 的 问题 。 
可 维护 性 
可 维护 性 以 保持 系统 正常 运行 并 及 时 更 新 为 参照 。 很 多 系统 需要 经 常 修改 ， 这 不 是 因为 
它们 不 能 很 好 地 运行 而 是 因为 外 部 因素 的 改变 。 例 如 ， 一 个 公司 的 工资 单 系统 就 不 得 不 经 常 
修改 以 满足 政府 法 律 和 规则 的 改变 。 

。 可 变性 是 个 主观 因素 。 但 是 ， 一 个 有 经 验 的 项 目 领 导 可 以 估计 出 多 长 时 间 需 要 发 生 一 
次 改变 请 求 。 如 果 持 续 时 间 太 长 可 能 是 因为 系统 很 难 改 变 。 这 一 点 对 于 老 系统 特别 正 
确 。 今 天 在 这 个 领域 有 很 多 软件 度量 工具 来 估算 程序 的 复杂 性 和 结构 。 

。 可 修正 性 的 一 种 度量 是 恢复 正常 的 平均 时 间 ， 也 就 是 当 程 序 发 生 故 障 后 使 程序 恢复 运 
行 所 花费 的 时 间 。 虽 然 它 是 反应 性 定义 ， 但 目前 还 没有 手段 来 预测 从 故障 中 改正 程序 
需要 花 多 长 时 间 。 

。 用 户 经 党 要 求 在 系统 中 进行 变动 。 适 应 性 是 个 定性 的 属性 ， 试 图 度量 进行 这 些 变动 的 
难 易 程度 。 如 果 一 个 系统 需要 完全 重 写 程序 来 进行 改变 ， 那 它 就 没有 灵活 性 。 

。 你 可 能 会 认为 可 测试 性 是 个 很 主观 的 领域 ， 但 测试 工程 师 有 包含 各 种 因素 的 检测 清单 
来 评估 系统 的 可 测试 性 。 

可 迁移 性 

可 迁移 性 是 指 把 数据 和 (或 ) 系统 从 一 个 平台 移动 到 另 一 个 平台 并 重用 代码 的 能 力 。 在 

很 多 情况 下 ， 这 不 是 一 个 很 重要 的 因素 。 另 一 方面 ， 如 果 你 编写 具 用 通用 性 的 软件 ， 那 么 可 
迁移 性 就 很 关键 了 。 

。 如果 编写 的 函数 可 以 在 不 同 的 程序 和 不 同 的 项 目 中 使 用 ， 那 么 它 具 有 很 好 的 重用 性 。 
好 的 程序 员 建 立 图 数 库 以 便 在 解决 类 似 的 问题 时 能 够 重用 这 些 函 数 。 

。 互 用 性 是 发 送 数据 给 其 他 系统 的 能 力 。 在 当今 高 度 集成 的 系统 中 ， 这 是 非常 需要 的 属 
性 。 事 实 上 ， 它 已 经 变 得 如 此 重要 以 至 操作 系统 现在 都 支持 系统 之 间 传 递 数据 的 能 
力 ， 例 如 在 文字 处 理 软件 和 电子 数据 表 之 间 传 递 数 据 。 

。 可 移植 性 是 一 种 把 软件 从 一 个 硬件 平台 转移 到 另 一 个 硬件 平台 的 能 力 。 


10.5 测试 阶段 
测试 阶段 的 目标 就 是 发 现 错误 ， 这 就 意味 着 良 
好 的 测试 策略 能 发 现 最 多 的 错误 。 有 两 种 测试 : 白 盒 





| 日 卫 Re o 穷尽 测试 
测试 和 黑 盒 测试 (图 10-11 )。 D 控制 结构 0 op 

口 ; 
10.5.1 和 白 盒 测试 图 10-11 软件 测试 


白 盒 测试 〈 或 玻璃 盒 测 试 ) 是 基于 知道 软件 内 部 
结构 的 。 测 试 的 目标 是 检查 软件 所 有 的 部 分 是 否 全 部 设计 出 来 。 白 盒 测试 假定 测试 者 知道 有 
关 软 件 的 一 切 。 在 这 种 情况 下 ， 程 序 就 像 玻璃 盒子 ， 其 中 的 每 件 事 都 是 可 见 的 。 日 盒 测 试 由 
软件 工程 师 或 一 个 专门 的 团队 来 完成 。 使 用 软件 结构 的 白 盒 测试 需要 保证 至 少 满足 下 面 4 条 
标准 : 

。 每 个 模块 中 的 所 有 独立 的 路 径 至 少 被 测试 过 一 次 。 

。 所 有 的 判断 结构 (两 路 的 或 多 路 的 ) 每 个 分 支 都 被 测试 。 

。 每 个 循环 被 测试 。 
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。 所 有 数据 结构 都 锌 测试 。 
在 过 去 ， 已 经 有 多 种 测试 方法 ， 我 们 只 讨论 其 中 的 两 种 : 基本 路 径 测 试 和 控制 结构 


1. 基本 路 径 测试 
基本 路 径 测试 是 由 Tom McCabe 提出 的 。 这 种 方法 创建 一 组 测试 用 例 ， 这 些 用 例 执行 软 


件 中 的 每 条 语句 至 少 一 次 。 
基本 路 径 测试 使 用 图 论 (参见 第 12 章 ) 和 图 复杂 性 找到 必须 被 走 过 的 独立 路 径 ， 从 而 
保证 每 条 语句 至 少 被 执行 一 次 。 
和 为 了 给 出 基本 路 径 测 试 的 理念 和 找到 部 分 程序 中 的 独立 路 径 ， 假 定 系 统 只 
由 一 个 程序 构成 ， 程 序 只 有 一 个 单 循环 ， 它 被 用 UML 图 显示 在 图 10-12 中 。 





图 10-12 基本 路 径 测 试 的 一 个 例子 


在 这 个 简单 的 程序 中 ， 有 3 条 独立 路 径 。 第 一 条 是 循环 被 跳 过 的 情况 。 第 二 条 是 通过 判 
断 结构 的 右 分 支 ， 循 环 被 执行 一 次 。 第 三 条 是 通过 判断 结构 的 左 分 支 ， 循 环 被 执行 一 次 。 如 
果 有 更 多 的 重复 ， 那 创建 的 路 径 是 不 独立 于 这 三 条 路 径 的 : 如 果 我 们 把 UML 图 改 成 流程 图 ， 
这 个 是 可 以 证 明 的 ， 但 我 们 必须 把 证 明 留 给 关于 软件 工程 的 书 。 设 计 测试 用 例 的 理念 就 是 覆 
盖 基 本 路 径 集中 的 所 有 3 条 路 径 ， 这 样 所 有 语句 至 少 被 执行 一 次 。 

2. 控制 结构 测试 

控制 结构 测试 比 基 本 路 径 测试 更 容易 理解 并 且 包含 基本 路 径 测试 ， 这 种 方法 使 用 下 面 将 
要 简要 讨论 的 不 同类 的 测试 。 

条 件 测试 

条 件 测试 应 用 于 模块 中 的 条 件 表达 式 ， 简 单条 件 是 关系 表达 式 ， 而 复合 条 件 是 简单 条 件 
和 逻辑 运算 符 (参见 第 9 章 ) 的 组 合 。 条 件 测试 用 来 检查 是 否 所 有 的 条 件 都 被 正确 设置 。 

数据 流 测试 

数据 流 测试 是 基于 通过 模块 的 数据 流 的 。 这 种 测试 选择 测试 用 例 ， 这 些 用 例 涉 及 检查 被 
用 在 赋值 语句 左边 的 变量 的 值 。 
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循环 测试 
循环 测试 使 用 测试 用 例 检查 循环 的 正确 性 。 所 有 类 型 的 循环 (while do 和 for) 被 仔细 测试 。 


10.5.2 黑 盒 测试 


黑 盒 测试 在 不 知道 程序 的 内 部 也 不 知道 程序 是 怎样 工作 的 情况 下 测试 程序 。 换 言 之 ， 程 
序 就 像 看 不 见 内 部 的 黑 盒 。 黑 盒 测试 按照 软件 应 该 完成 的 功能 来 测试 软件 ， 如 它 的 输入 和 输 
出 。 下 面 介绍 几 种 黑 盒 测试 方法 。 

1. 穷尽 测试 

最 好 的 黑 盒 测试 方法 就 是 用 输入 域 中 的 所 有 可 能 的 值 去 测试 软件 。 但 是 ， 在 复杂 的 软件 
中 ， 输 入 域 是 如 此 巨大 ， 这 样 做 常常 不 现实 。 


2. 随机 测试 
在 随机 测试 中 ， 选 择 输入 域 的 值 的 子 集 来 测试 ， 子 集 选 择 的 方式 ( 值 在 输入 域 上 的 分 


布 ) 是 非常 重要 的 。 在 这 种 情况 下 ， 随 机 数 生 成 器 是 非常 有 用 的 。 


3. 边界 值 测 试 
当 遇 到 边界 值 时 ， 错 误 经 常 发 生 。 例 如 ， 一 个 模块 定义 它 的 输入 必须 大 于 或 等 于 100， 


那 这 个 模块 用 边界 值 100 来 测试 就 非常 重要 。 如 果 模 块 在 边界 值 出 错 ， 那 有 可 能 就 是 模块 代 
码 中 的 有 些 条 件 ， 例 如 ，x 宇 100 被 写成 x>100。 


10.6 文档 

软件 的 正确 使 用 和 有 效 维护 离 不 开 文档 。 通 常 软件 有 三 种 独立 的 文档 : 用 户 文档 、 系 统 
文档 和 技术 文档 。 注 意 ， 文 档 是 一 个 持续 的 过 程 。 如 果 软 件 在 发 布 之 后 有 问题 ， 也 必须 写 文 
档 。 如 果 软 件 被 修改 ， 那 么 所 有 的 修改 和 与 原 软件 包间 的 关系 都 要 被 写 进 文档 。 只 有 当 软 件 
包 过 时 后 ， 编 写 文档 才 停止 。 z 


_ 文 稍 是 一 个 持续 的 对 各 了 下 人 提 罗 证 


10.6.1 ”用户 文档 
为 了 软件 包 正 常 运行 ， 传 统 上 称 为 用 户 手册 的 文档 对 用 户 是 必 不 可 少 的 。 它 告诉 用 户 如 
何 一 步 步 地 使 用 软件 包 。 它 通常 包含 一 个 教程 指导 用 户 熟 悉 软 件 包 的 各 项 特性 。 , 
一 个 好 的 用 户 手 册 能 够 成 为 一 个 功能 强大 的 营销 工具 。 用 户 文档 在 营销 中 的 重要 性 再 强 
调 也 不 过 分 。 手 册 应 该 面向 新 手 和 专业 用 户 。 配 有 好 的 用 户 文 档 必定 有 利于 软件 的 销量 。 


10.6.2 ”系统 文档 


系统 文档 定义 软件 本 身 。 撰 写 系统 文档 的 目的 是 让 原始 开发 人 员 之 外 的 人 能 够 维护 和 修 
改 软 件 包 。 系 统 文档 在 系统 开发 的 所 有 4 个 阶段 都 应 该 存在 。 

在 分 析 阶 段 ， 收 集 的 信息 应 该 仔细 地 用 文档 记录 。 另 外 ， 系 统 分 析 员 应 该 定义 信息 的 来 
源 。 需 求 和 选用 的 方法 必须 用 基于 它们 的 推论 来 清楚 表述 。 

在 设计 阶段 ， 最 终 版 本 中 用 到 的 工具 必须 记录 在 文档 中 。 例 如 ， 如 果 结 构图 修改 了 多 
次 ， 那 么 最 终 的 版 本 要 用 完整 的 注释 记录 在 案 。 

在 实现 阶段 ， 代 码 的 每 个 模块 都 应 记录 在 文档 中 。 另 外 ， 代 码 应 该 使 用 注释 和 描述 头 尽 
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可 能 详细 地 形成 目 文档 。 


最 后 ， 开 发 人 员 必 须 仔细 地 形成 测试 阶段 的 文档 。 对 最 终 产品 使 用 的 每 种 测试 ， 连 同 它 
的 结果 都 要 记录 在 文档 中 。 甚 至 令 人 不 快 的 结果 和 产生 它们 的 数据 也 要 记录 在 案 。 


10.6.3 ”技术 文档 


技术 文档 描述 了 软件 系统 的 安装 和 服务 。 安 装 文档 描述 了 软件 如 何 安装 在 每 台 计 算 机 
上 ， 如 服务 器 和 客户 端 。 服 务 文档 描述 了 如 果 需 要 ， 系 统 应 该 如 何 维护 和 更 新 。 


10.7 章 末 材料 
推荐 读物 


有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


2001 


McGraw-Hill, 2005 


Hill, 2005 


Hill, 2007 


关键 术语 


analysis phase (分 析 阶 段 ) 

attribute( 属 性) 

basis path testing (基本 路 径 测 试 ) 
black-box testing ( 黑 盒 测试 ) 

class diagram (类 图 ) 

cohesion( 内 聚 ) 

control structure testing (控制 结构 测试 ) 
cohesion (耦合 ) 

data flow diagram (数据 流 图 ) 

design phase (设计 阶段 ) 

development process (开发 过 程 ) 
entity-relationship diagram (实体 关系 图 ) 
glass-box testing ( 白 盒 测试 ) 
implementation phase (实现 阶段 ) 
incremental model ( 增 量 模型 ) 
maintainability (可 维护 性 ) 

modularity (模块 化 ) 

object-oriented analysis (面向 对 象 分 析 ) 


Braude, E. Software Engineering—An Object-Oriented Perspective, New York: Wiley, 


Gustafson, D,. Software Engineering, New York: McGraw-Hill, 2002 
Lethbridge, T. and Laganiere, R. Object—Oriented Software Engineering, New York: 


Pressman, R. Software Engineering: A Practitioner's Approach, New York: McGraw- 


Schach, S. Object-Oriented and Classical Software Engineering, New York: McGraw- 


object-oriented design (面向 对 象 设计 ) 
operability (可 操作 性 ) 

procedure-oriented analysis (面向 过 程 分 析 ) 
procedure-oriented design (面向 过 程 设计 ) 
software engineering (软件 工程 ) 

software lifecycle (软件 生命 周期 ) 
software quality (软件 质量 ) 

state chart (状态 图 ) 

state diagram (状态 图 ) 

structure chart (结构 图 ) 

technical documentation (技术 文档 ) 
testability (可 测试 性 ) 

testing phase (测试 阶段 ) 

transferability (可 迁移 性 ) 

use-case diagram (用 例 图 ) 

waterfall model (瀑布 模型 ) 

white-box testing (日 盒 测 试 ) 
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小 结 

。 软件 生命 周期 是 软件 工程 中 的 基本 概念 ， 像 许多 产品 一 样 ， 软 件 也 经 历 一 个 重复 阶段 
的 周期 。 

"在 软件 生命 周期 中 ， 开 发 过 程 包括 4 个 阶段 ; 分析、 设计 、 实 现 和 测试 。 在 这 些 
阶段 中 都 有 一 些 相关 的 模型 被 使 用 。 我 们 讨论 两 种 最 通用 的 ; 瀑布 模型 和 增 量 
模型 。 | 

。 整个 开发 过 程 始 于 分 析 阶 段 ， 这 个 阶段 产生 了 规格 说 明文 档 ， 这 个 文档 说 明了 软件 要 
做 什么 ， 而 没有 说 明 如 何 去 做 。 分 析 阶 段 可 以 使 用 两 种 方法 : 面向 过 程 分 析 和 面向 对 
象 分 析 。 

。 设 计 阶 段 定义 了 系统 如 何 完成 在 分 析 阶 段 所 定义 的 。 在 面向 过 程 设计 中 ， 整 个 工程 被 
分 解 成 一 组 过 程 或 模块 。 在 面向 对 象 设计 中 ， 设 计 阶 段 通过 详细 列 出 类 中 的 细节 而 
继续 。 

。 模块 化 是 将 大 程序 分 解 成 能 理解 和 容易 处 理 的 小 程序 。 当 系统 被 分 解 成 模块 时 ， 有 两 
个 问题 很 重要 : 耦合 和 内 聚 。 耦 合 是 对 两 个 模块 互相 绑 定 紧密 程度 的 度量 。 在 软件 系 
统 中 的 模块 间 的 耦合 必须 最 小 化 。 内 聚 是 程序 中 处 理 过 程 相关 紧密 程度 的 度量 。 在 软 


件 系 统 中 的 模块 间 的 内 聚 必须 最 大 化 。 
。 在 实现 阶段 ， 程 序 员 为 面向 过 程 设 计 中 的 模块 编写 代码 或 编写 程序 单元 ， 实 现 面 向 对 
象 设计 的 类 。 
人 
迁移 性 。 


。 测试 阶段 的 目标 就 是 发 现 错误 ， 有 两 类 测试 : 白 盒 测试 和 黑 盒 测试 。 白 盒 测试 (或 玻 
璃 盒 测 试 ) 是 基于 知道 软件 的 内 部 结构 的 。 白 盒 测 试 假定 测试 者 知道 一 切 。 黑 盒 测 试 
在 不 知道 内 部 是 什么 ， 也 不 知道 它 是 如 何 工作 的 情况 下 测试 软件 。 


10.8 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q10-1 定义 “软件 生命 周期 ”。 

Q10-2 区 分 瀑布 模型 和 增 量 开发 模型 。 

Q10-3 ”软件 开发 的 4 个 阶段 是 什么 ? 

Q10-4 说明 分 析 阶 段 的 目标 ， 描 述 此 阶段 中 的 两 种 趋势 。 
Q10-5 说 明 设 计 阶段 的 目标 ， 描 述 此 阶段 中 的 两 种 趋势 。 
Q10-6 ”描述 模块 化 ,说 出 与 模块 化 有 关 的 两 个 问题 。 
Q10-7 ”描述 耦合 和 内 聚 之 间 的 区 别 。 

Q10-8 ”说明 实现 阶段 的 目标 ， 描 述 此 阶段 中 的 质量 问题 。 
Q10-9 说明 测试 阶段 的 目标 ， 列 出 两 类 测试 。 

Q10-10 ”描述 白 盒 测试 和 黑 盒 测试 之 间 的 区 别 。 
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练习 题 


P10-1 


P10-2 


P10-3 


P10-4 
P10-5 
P10-6 
P10-7 
P10-8 
P10-9 
P10-10 
P10-11 
P10-12 
P10-13 
P10-14 
P10-15 
P10-16 
P10-17 
P10-18 


P10-19 
P10-20 


在 第 9 章 中 ,我 们 解释 了 常量 的 使 用 比 字 面值 更 受 欢迎 。 这 种 偏好 对 软件 生命 周期 的 影响 是 
什么 ? 

在 第 9 章 中 ， 我 们 说 明了 模块 间 的 通信 可 以 通过 传 值 或 传 引 用 来 进行 。 哪 一 种 提供 了 模块 间 
更 少 的 耦合 ? ， 

在 第 9 章 中 ， 我 们 说 明了 模块 间 的 通信 可 以 通过 传 值 或 传 引用 来 进行 。 哪 一 种 提供 了 模块 间 
更 多 的 内 聚 ? 

画 出 一 个 简单 图 书馆 的 用 例 图 。 

画 出 一 个 小 杂货 店 的 用 例 图 。 

显示 简单 数学 公式 x+) 的 数据 流 图 。 

显示 简单 数学 公式 xxy+zxL 的 数据 流 图 。 

显示 图 书馆 的 数据 流 图 。 

显示 小 杂货 店 的 数据 流 图 。 

创建 练习 题 P10-8 的 结构 图 。 

创建 练习 题 P10-9 的 结构 图 。 

显示 固定 容量 的 堆栈 (参见 第 12 章 ) 的 状态 图 。 

显示 固定 容量 的 队列 (参见 第 12 章 ) 的 状态 图 。 

创建 图 书馆 的 类 图 。 

创建 小 杂货 店 的 类 图 。 

显示 练习 题 P10-14 中 类 的 细节 。 

显示 练习 题 P10-15 中 类 的 细节 。 

一 个 程序 的 输入 由 1000 到 1999 范围 (包含 ) 中 的 三 个 整数 构成 。 求 出 测试 这 些 数字 的 所 有 
组 合 的 穷尽 测试 的 数目 。 

列 出 练习 题 P10-18 中 所 需要 的 边界 值 测试 。 

一 个 随机 数 生成 器 能 生成 0 到 0.999 间 的 一 个 数 。 该 随机 数 生 成 器 是 如 何 用 来 做 练习 题 P10- 


18 中 所 描述 的 系统 的 随机 测试 的 ? 


| 第 1 章 |: 
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数据 结构 


在 前 面 的 章节 中 ， 我 们 使 用 变量 来 存储 单个 实体 ， 尽 管 单 变量 在 程序 设计 语言 中 被 大 量 
使 用 ， 但 它们 不 能 有 效 地 解决 复杂 问题 。 本 章 将 介绍 数据 结构 ， 它 是 第 12 章 抽象 数据 类 型 
(Abstact Data Type，ADT) 的 前 奏 。 

数据 结构 利用 了 有 关 的 变量 的 集合 ， 而 这 些 集合 能 够 单独 或 作为 一 个 整体 被 访问 。 换 名 
话说 ， 一 个 数据 结构 代表 了 有 特殊 关系 的 数据 的 集合 。 本 章 将 讨论 三 种 数据 结构 : 数组 、 记 
录 和 链表 ， 大 多 的 编程 语言 都 隐 式 实现 了 前 两 种 而 第 三 种 则 通过 指针 和 记录 来 模拟 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 

。 定义 数据 结构 ; 

。 把 数组 定义 为 数据 结构 ， 并 说 明 它 是 如 何 用 于 存储 数据 项 列表 的 ; 

。 区 分 数组 的 名 字 和 数组 中 元 素 的 名 字 ; 

。 描述 为 数组 定义 的 操作 ; 

。 把 记录 定义 为 数据 结构 ， 并 说 明 它 是 如 何 用 于 存储 属于 单个 数据 元 素 的 属性 ; 

。 区 分 记录 的 名 字 和 它 的 域 的 名 字 ，; 

。 把 链表 定义 为 数据 结构 ， 并 说 明 它 是 如 何 用 指针 来 实现 的 ; 

。 描述 为 链表 定义 的 操作 ; 

。 比较 和 区 分 数组 、 记 录 和 链表 ; 

。 说 明 数 组 、 记 录 和 链表 的 应 用 。 


11.1 数组 
假设 有 100 个 分 数 ， 我 们 需要 读 入 这 些 数 ， 处 理 它们 并 打印 。 同 时 还 要 求 将 这 100 个 
分 数 在 处 理 过 程 中 保留 在 内 存 中 。 可 以 定义 100 个 变量 ， 每 个 都 有 不 同 的 名 字 ， 如 图 11-1 


所 示 。 
但 是 定义 100 个 不 同 的 变量 名 带 来 了 其 他 问题 ， 我 们 需要 100 个 引用 来 读 它 们 ; 需 
要 100 个 引用 来 处 理 它们 ; 需要 100 个 引用 来 写 它 们 。 图 11-2 给 出 了 说 明 这 个 问题 的 示 


意图 。 










开始 
corel ) 
score] 
score100 ®) 二 


图 11-1 100 个 独立 变量 图 11-2 ”处理 100 个 独立 变量 
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即使 是 处 理 这 些 数 目 相 对 较 小 的 分 数 ， 我 们 需要 的 指令 数目 也 是 无 法 接受 的 。 为 了 处 理 
大 量 的 数据 ， 需 要 一 个 数据 结构 ， 如 数组 。 

数组 是 元 素 的 顺序 集合 ， 通 常 这 些 元 素 具有 相同 的 数 
据 类 型 。 我 们 可 以 称 数组 中 的 元 素 为 第 一 个 元 素 、 第 二 个 
元 素 等 ， 直 到 最 后 一 个 元 素 。 如 果 将 100 个 分 数 放 进 数组 
中 ， 可 以 指定 元 素 为 scores[1] 、scores[2]， 等 等 。 索 引 表 示 “数组 
元 素 在 数组 中 的 顺序 号 ， 顺 序号 从 数组 开始 处 计数 。 数 组 
元 素 通 过 索引 被 独立 给 出 了 地 址 (图 11-3 )， 这 个 数组 整体 
上 有 个 名 称 scores， 但 每 个 数 可 以 利用 它 的 索引 来 单独 图 11-3 带 索 引 的 数组 
访问 。 

我 们 可 以 使 用 循环 来 读 写 数组 中 的 元 素 ， 也 可 以 使 用 循环 来 处 理 元 素 。 现 在 我 们 可 以 
不 管 要 处 理 的 元 素 是 100 个 、1000 个 或 10 000 个 ,循环 使 得 处 理 它们 变 得 容易 。 我 们 可 以 
使 用 一 个 整数 变量 来 控制 循环 ， 只 要 变量 的 值 小 于 数组 中 元 素 的 个 数 ， 那 还 在 循环 体 里 面 


(图 11-4)。 
我 们 是 从 1 开始 索引 的 ;但 有 些 现代 语言 (如 C: C++ 和 Java) 是 从 0 开始 索引 的 。 
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图 11-4 ”处理 一 个 数组 


(8 比较 处 理 图 11-2 中 的 100 个 独立 元 素 所 需 的 指令 条 数 和 处 理 图 11-4 中 的 数 
组 中 的 100 个 元 素 所 需 的 指令 条 数 。 假 定 处 理 每 个 分 数 只 需要 一 条 指令 。 

解 ”在 第 一 种 情况 下 ， 需 要 100 条 指令 去 读 ; 100 条 指令 去 写 ; 100 条 指令 去 处 理 。 总 
共 的 指令 条 数 是 300。 

在 第 二 种 情况 下 ， 有 三 个 循环 ， 每 个 循环 中 有 两 条 指令 ， 共 6 条 指令 。 但 是 ， 我 们 还 需 
要 3 条 指令 来 初始 化 索引 ，3 条 指令 来 检查 索引 的 值 ， 所 以 总 共有 12 条 指令 。 

了 如 果 使 用 数组 ,计算 机 需要 执行 的 周期 次 数 ( 取 数 、 译 码 和 执行 阶段 ) 并 没 
有 减少 ， 周 期 的 次 数 实际 上 还 增加 了 ， 因 为 我 们 有 额外 的 初始 化 、 增 量 和 测试 索引 的 值 的 负 
担 。 但 是 我 们 关心 的 不 是 周期 的 次 数 ， 而 是 我 们 需要 写 的 程序 的 行 数 。 
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蕊 本 EE< 汪 在 计算 机 科学 中 ， 有 一 个 很 大 的 问题 就 是 程序 的 重用 性 ， 例 如 ， 如 果 数 据 
项 的 数目 改变 了 ， 程 序 中 有 多 少 需要 修改 的 地 方 。 假 定 我 们 写 了 两 个 程序 分 别处 理 图 11-2 
和 图 11-4 中 的 分 数 ， 如 果 分 数 的 数目 由 100 变 成 1000， 我们 需要 在 每 个 程序 中 做 多 少 
修改 ? 

在 第 一 个 程序 中 ， 需 要 增加 3 x 900=2700 条 指令 ; 在 第 二 个 程序 中 ， 只 需要 修改 三 个 
条 件 (I> 100 到 I> 1000 )。 我 们 实际 上 能 修改 图 11-4 中 的 流程 图 ， 使 得 要 修改 的 数目 为 1。 


11.1.1 数组 名 与 元 素 名 

在 一 个 数组 中 ， 有 两 种 标识 符 : 数组 的 名 字 和 各 个 元 素 的 名 字 。 数 组 名 是 整个 结构 的 名 
字 ， 而 元 素 的 名 字 人 允许 我 们 查阅 这 个 元 素 。 在 图 11-3 的 数组 中 ， 数 组 的 名 字 是 scores， 而 
每 个 元 素 的 名 字 是 这 个 名 字 后 面 跟 索 引 ， 如 scores[1] 、scores[2] 等 。 在 本 章 中 ， 我 们 大 部 分 
需要 的 是 元 素 的 名 字 ， 但 是 ， 在 有 些 语言 (如 C) 中 ， 也 需要 使 用 数组 的 名 字 。 


11.1.2 ”多维 数组 
到 目前 为 止 ， 我 们 所 讨论 的 都 是 一 维 数组 ， 因 为 数据 仅 是 在 一 个 方向 上 线性 组 成 。 许 多 


的 应 用 要 求 数据 存储 在 多 维 中 。 常 见 的 例子 如 
表格 ， 就 是 包括 行 和 列 的 数组 。 图 11-5 给 出 了 站 scores[2][3] 








一 个 表格 ， 通 常 称 为 二 维 数组 。 中 B] 的 
图 11-5 中 数组 包含 了 一 个 班级 的 学 生成 

绩 。 这 个 班级 有 5 位 学 生 ， 每 个 学 生 有 4 种 测 《去 ) | [3 

验 的 不 同 成 绩 。 变 量 scores[2][3] 显示 了 第 二 [4] 


个 学 生 在 第 三 次 测验 中 的 成 绩 。 把 成 绩 组 织 成 日 
二 维 数组 有 助 于 教师 发 现 每 个 学 生 的 平均 成 绩 
行 值 上 的 平均 ) 和 每 次 测验 的 平均 成 绩 ( 列 值 
上 的 平均 )， 还 有 所 有 测验 的 平均 成 绩 ( 整 表 的 平均 )。 
多 维 数组 (多 于 二 维 的 数组 ) 也 是 可 以 的 。 但 是 ， 在 本 书 中 我 们 不 讨论 多 于 二 维 的 


数组 。 


11.1.3 存储 配置 

_ 流 歼 扯 的 迷 引 间接 由 多 了 元 玉 丰 实际 疮 对 上 上 状 相 才 和 本。 Ns 
在 内 存 中 如 何 存储 每 个 元 素 取决 于 计算 机 ， By 
大 多 数 计算 机 使 用 行 主 序 存 储 ， 其 中 数组 
的 一 个 整 行 在 内 存 上 存储 在 下 一 个 行 之 前 。 
但 是 计算 机 也 可 以 使 用 列 主 序 存储 ， 其 中 
一 个 整 列 在 内 存 上 存储 在 下 一 个 列 之 前 。 
图 11-6 显示 了 一 个 二 维 数组 以 及 它 是 如 何 
以 行 主 序 存 储 和 列 主 序 存储 的 。 行 主 序 存 “ 行 主 序 存储 
储 更 常见 些 。 11-6 ”数组 的 存储 配置 

(人 我 们 在 内 存 上 有 一 个 二 
数组 students。 数 组 是 100 x 4 的 (100 行 和 4 列 )。 假 定 元 素 students[1][1] 是 存储 在 存储 介 
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质 上 ， 地 址 为 1000， 每 个 元 素 只 占 一 个 存储 地 址 ， 求 元 素 students[5][3] 的 地 址 。 计 算 机 使 
用 行 主 序 存储 。 

解 假定 每 个 元 素 只 占 一 个 存储 地 址 ， 我 们 能 使 用 下 列 公式 找到 元 素 的 地 址 : 

y=x + Cols x (i-1) 十 0-1) 

这 里 x 表示 开始 地 址 ，Cols 表示 数组 中 列 的 数目 , i 表示 元 素 的 行 号 , j 表示 元 素 的 列 号 ， 

而 就 是 要 找 的 地 址 。 在 本 例 中 , x 为 1000，Cols 为 4, i 为 5, j 为 3， 要 找 的 y 是 : 
y=x+ ColsX(i-1)+ (0-1)=1000 + 4(5-1) + (3-1)=1018- 

因为 我 们 的 元 素 是 处 在 第 5 行 和 第 3 列 上 ， 所 以 我 们 的 答案 是 有 道理 的 。 在 这 个 元 素 的 
前 面 有 4 行 ， 占据 了 16 (4x4) 个 存储 地 址 。 第 5 行 的 前 两 列 也 占据 了 两 个 地 址 。 这 就 意 
0 
那么 目标 元 素 占 据 的 地 址 就 是 1018。 


11.1.4 数组 操作 


虽然 我 们 能 应 用 一 些 为 数组 中 每 个 元 素 定 义 的 通常 操作 (参见 第 4 章 )， 但 我 们 还 能 定 
义 一 些 把 数组 作为 数据 结构 的 操作 ， 数 组 作为 结构 的 常用 操作 有 : 查找 、 插 入 、 删 除 、 检 索 
和 遍历 。 

1. 查找 元 素 

当 我 们 知道 元 素 的 值 时 ， 经 常 需要 找到 元 素 的 序号 。 这 种 操作 在 第 8 章 讨 论 过 。 我 们 可 
以 对 未 排序 的 数组 使 用 顺序 查找 ， 对 排序 的 数组 使 用 折 半 查找 。 下 面 三 种 操作 都 要 使 用 查找 
操作 。 

2. 元 素 的 插 人 

通常 ， 计 算 机 语言 要 求 数组 的 大 小 (数组 中 元 素 的 个 数 ) 在 程序 被 写 的 时 候 就 被 定义 ， 
防止 在 程序 的 执行 过 程 中 被 修改 。 最 近 ， 有 些 语言 允许 可 变 长 数组 。 即 使 语言 允许 可 变 长 数 
组 ， 在 数组 中 插入 一 个 元 素 仍 需 要 十 分 小 心 。 

尾部 插入 

如 果 插 入 操作 在 数组 尾部 进行 ， 而 且 语 言 允 许 增加 数组 的 大 小 ， 那 么 可 以 很 容易 完成 这 
个 操作 。 例 如 ， 如 果 一 个 数组 中 有 30 个 元 素 ， 我 们 把 数组 的 大 小 增 到 31， 并 把 新 数据 项 作 
为 第 31 项 插入 。 

开始 或 中 间 插 入 

如 果 插 入 是 在 数组 的 开始 或 中 间 ， 过 程 就 是 元 长 的 和 花费 时 间 的 。 当 我 们 需要 在 一 个 有 
序 的 数组 中 插入 一 个 元 素 时 ， 这 就 发 生 了 。 就 像 前 面 描述 的 ， 首 先 查 找 数组 。 找 到 插入 的 位 
置 后 ， 择 人 新 的 元 素 。 例 如 ， 如 果 要 在 30 个 元 素 的 数组 中 插入 一 个 新 的 元 素 ， 作 为 第 9 个 
元 素 ， 那 么 9 一 30 的 元 素 应 该 同 数组 尾部 移动 一 个 元 素 ， 以 留 出 第 9 个 元 素 的 位 置 用 来 插 
入 。 下 面 显示 了 需要 被 应 用 于 数组 的 部 分 伪 代 码 : 

| > 

while (i 之 9) 

array [i+1) 4 array[i]) 
a | 


} 
array [ij 一 newValue 
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注意 ， 移 位 需要 在 数组 的 尾部 进行 ， 以 防止 元 素 值 的 丢失 。 代 码 首先 把 第 30 个 元 素 的 
值 复制 到 第 31 个 元 素 中 ， 接 着 复制 第 29 个 元 素 的 值 到 第 30 个 元 素 中 ， 以 此 类 推 。 当 代码 
离开 循环 时 ， 第 9 个 元 素 的 值 已 经 复制 到 第 10 个 元 素 中 。 最 后 一 行 把 新 数据 项 的 值 复制 到 
第 9 个 元 素 中 。 

3. 元 素 的 删除 

在 数组 中 删除 一 个 元 素 就 像 插 入 操作 一 样 元 长 和 琅 手 。 例 如 ， 如 果 要 删除 第 9 个 元 素 ， 
则 需要 把 第 10 个 元 素 到 第 30 个 元 素 向 数组 的 开始 位 置 移动 一 个 位 置 。 我 们 把 这 个 操作 的 伪 
代码 留 作 练习 ， 它 与 增加 一 个 元 素 相似 。 

4. 检索 元 素 

检索 操作 就 是 随便 地 存 取 一 个 元 素 ， 达 到 检查 或 复制 元 素 中 的 数据 的 目的 。 与 插入 和 
删除 操作 不 同 ， 当 数据 结构 是 数组 时 ， 检 索 是 一 个 容易 的 操作 。 实 际 上 ， 数 据 是 随机 存 取 结 
构 ， 这 意味 着 数组 的 每 个 元 素 可 以 随机 地 被 存 取 ， 而 不 需要 存 取 该 元 素 前 面 的 元 素 或 后 面 的 
元 素 。 例 如 ， 如 果 需 要 检索 数组 中 的 第 9 个 元 素 的 值 ， 只 用 一 条 指令 就 能 做 到 。 显 示 如 下 ; 


RetrieveValue 二 array[9] 


5. 数组 的 遍历 

数组 的 遍历 是 指 被 应 用 于 数组 中 每 个 元 素 上 的 操作 ， 如 读 、 写 、 应 用 数学 的 运算 等 。 

算法 11.1 给 出 了 求 数组 中 元 素 的 平均 值 的 例子 ， 数 组 的 元 素 是 实数 。 算 法 首先 使 用 循 
环 求 出 元 素 的 和 ， 循 环 结束 后 ， 求 得 平均 值 ， 它 是 和 除 以 元 素 的 个 数 。 注 意 : 为 了 正确 计算 
和 ， 在 循环 前 ， 需 要 设置 为 和 0.0。 


算法 11.1 计算 数组 中 元 素 的 平均 值 


算法 ; ArrayAverage (Array,n) 
目的 ; 求 平均 值 
前 提 : 给 定 一 个 数组 Array 和 元 素 的 个 数 n 


; 无 
返回 ; 平均 值 

sum +4— 0.0 

和 


while (i 和 D) 
{ 
Sum + sum + Arrayl[i) 
| 
} 
average 人 t 一 Sum / n 
Return (average) 


} 


11.1.5 ”字符 串 


字符 串 是 字符 的 集合 ， 不 同 的 语言 对 于 字符 串 的 处 理 并 不 相同 。 在 C 语言 中 ， 一 个 字 
符 串 指 的 是 由 字符 构成 的 数组 ; 在 C++ 中 ， 字 符 串 即 可 以 指 字 符 构 成 的 数组 ， 也 可 以 指 一 
种 名 叫 string 的 数据 类 型 ; 在 Java 中 ， 字 符 串 是 一 种 数据 类 型 。 


11.1.6 ”数组 的 应 用 
考虑 一 下 前 一 节 所 讨论 的 操作 ， 就 给 出 了 数组 应 用 的 提示 。 如 果 有 一 个 表 ， 在 表 创 建 后 
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有 大 量 的 插入 和 删除 操作 要 进行 ， 这 时 就 不 应 该 使 用 数组 。 当 删除 和 插入 操作 较 少 ， 而 有 大 
量 的 查找 和 检索 操作 时 ， 这 时 比较 适合 使 用 数组 。 


当 需 要 进行 的 插入 和 删除 操作 数目 较 少 ， 而 需要 大 量 的 查找 和 检索 操作 时 ， 数组 是 全 
适 的 结构 。 从 流 认 这 5 


11.2 ”记录 

记录 是 一 组 相关 元 素 的 集合 ， 它 们 可 能 是 不 同 的 类 型 ， 但 整个 记录 有 一 个 名 称 。 记 录 
中 的 每 个 元 素 称 为 域 。 域 是 具有 含义 的 最 小 命名 数据 。 它 有 类 型 且 存 在 于 内 存 中 。 它 能 被 赋 
值 ， 反 之 也 能 够 被 选择 和 操纵 。 域 不 同 于 变量 主要 在 于 它 是 记录 的 一 部 分 。 

图 11-7 中 给 出 了 两 个 记录 的 实例 。 第 一 个 例子 是 fraction 记录 ， 它 有 两 个 域 ， 都 是 整 
型 。 第 二 个 例子 是 student 记录 ， 它 有 三 个 域 ， 包 含 了 两 种 不 同 的 数据 类 型 。 


”记录 中 的 元 素 可 以 是 相同 类 型 或 不 同类 型 ， 但 记录 中 的 所 有 元 素 必须 是 关联 的 5 


ob 
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11-7 记录 
记录 中 的 数据 必须 都 与 一 个 对 象 关 联 。 在 图 11-7 中 ，fraction 中 的 整数 都 属于 同一 个 


fraction 对 象 ， 而 第 二 个 例子 的 数据 则 都 与 student 关联 。( 注 意 我 们 把 字符 串 放 在 双 引 号 之 
间 ， 而 单个 字符 放 在 单 引号 之 间 ， 这 个 是 大 多 数 编程 语言 通常 使 用 的 。) 


11.2.1 记录 名 与 域名 


就 像 数 组 一 样 ， 在 记录 中 也 有 两 种 标识 符 : 记录 的 名 字 和 记录 中 各 个 域 的 名 字 。 记 录 的 
名 字 是 整个 结构 的 名 字 ， 而 每 个 域 的 名 字 人 允许 我 们 存 取 这 些 域 。 例 如 ， 图 11-7 的 student 记 
录 中 ， 记 录 的 名 字 是 student， 域 的 名 字 是 student.id、student.name 和 student.grade。 大 多 
数 编程 语言 使 用 点 〈.) 来 分 隔 结构 (记录) 名 和 它 成 员 ( 域 ) 的 名 字 。 这 是 我 们 在 本 书 中 的 
约定 。 

太阳 下 而 各 示 了 图 11-7 中 的 域 值 是 如 何 被 存储 的 。 


student.id +— 2005 student ,name 二 "G, Boole" Student .grade + 'A! 


11.2.2 ”记录 与 数组 的 比较 


我 们 可 以 从 概念 上 对 数组 和 记录 进行 比较 。 这 样 有 助 于 我 们 理解 什么 时 候 应 该 使 用 数 
组 ， 什 么 时 候 应 该 使 用 记录 。 数 组 定义 了 元 素 的 集合 ， 而 记录 定义 了 元 素 可 以 确认 的 部 分 。 
例如 ， 数 组 可 以 定义 一 个 班级 的 学 生 〈 40 位 学 生 )， 而 记录 定义 了 学 生 不 同 的 属性 ， 如 标识 、 


姓名 或 成 绩 等 。 


发 据 纤 药 





11.2.3 ”记录 数组 


如 果 我 们 需要 定义 元 素 的 集合 ， 且 同时 需要 定义 元 素 的 属性 ， 上 二 
例如 ， 在 一 个 有 30 位 学 生 的 班级 中 我 们 可 以 rs rr 
有 一 个 30 个 记录 的 数组 ， 每 个 记录 表示 一 位 学 NT prade 
生 。 图 11-8 显示 了 一 个 具有 30 个 称 为 students svenst2 [JT] 
的 学 本 记 录 芍 南 四 ， es A 

在 记录 数组 中 ， 数 组 的 名 字 定 义 了 整个 结 
构 ， 作 为 一 个 整体 的 学 生 组 。 为 了 定义 每 个 元 
素 ， 我 们 需要 使 用 相应 的 索引 。 为 了 定义 元 素 shdens [30] [i 
enn teh 

， 首 先 定义 元 素 ， 然 后 才能 定义 元 素 的 部 分 。 图 11.8 ”记录 数组 
Ee 第 3 个 学 生 的 标识 被 定义 为 : 

(student [3]) .id 

注意 ， 我 们 使 用 了 括号 来 强调 首先 这 个 特别 的 学 生 要 被 选择 ,然后 才 是 这 个 学 生 的 标 
识 。 换 言 之 ， 括 号 告诉 我 们 索引 运算 符 要 先 于 点 运算 符 。 在 某 些 语言 中 ， 这 里 是 不 需要 括号 
的 ， 因 为 这 种 优先 已 经 在 语言 本 身 中 建立 了 。 但 使 用 括号 能 总 是 保证 这 样 的 优先 。 


0 下 面 显示 了 我 们 是 如 何 访问 学 生 数组 中 的 每 个 记录 域 ， 并 在 其 中 存 人 值 的 。 


(student[1]) ,id 二 1001 (student [1]) ,name 坟 "JIJ,Aron'" (student [1]) .grade+— 'A!' 
(student [2]) .id<—2007 .2 name ~— "F.Bush" VE EE ER Sr 


og i 
(student [30]).id*—3012 (student[30]) .name*—"M.Blair" (student[30]) .grade+— 'B' 


C0 但 是 ,我们 通常 是 使 用 循环 来 读 记 录 数 组 中 的 数据 的 。 算 法 11.2 显示 了 这 
个 过 程 的 部 分 伪 代码 。 


students [1] 上 





算法 11.2 ” 读 学 生 记录 的 部 分 伪 代 码 


并 

while (i < 31) 

{ 
read(student [i]) .id 
read(student {i]) .name 
read (student[i]) .grade 
:i 


11.2.4 数组 与 记录 数组 


数组 和 记录 数组 都 表示 数据 项 的 列表 。 数 组 可 以 被 看 成 是 记录 数组 的 一 种 特例 ， 其 中 每 
个 元 素 是 只 带 一 个 域 的 记录 。 


11.3 ”链表 


链表 是 一 个 数据 的 集合 ， 其 中 每 个 元 素 包 含 下 一 个 元 素 的 地 址 ; 即 每 个 元 素 包含 两 部 
分 : 数据 和 链 。 数 据 部 分 包含 可 用 的 信息 ， 并 被 处 理 。 链 则 将 数据 连 在 一 起 ， 它 包含 一 个 指 
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明 列 表 中 下 一 个 元 素 的 指针 (地址 )。 男 外 ， 一 个 指针 变量 标识 该 列表 中 的 第 一 个 元 素 。 列 
表 的 名 字 就 是 该 指针 变量 的 名 字 。 
图 11-9 显示 了 一 个 称 为 scores 的 链表 ， 它 含有 4 个 元 素 。 除 最 后 一 个 元 素 外 ， 其 他 每 
个 元 素 的 链接 指向 它 的 后 继 节点 。 链 表 中 最 后 一 个 元 素 包含 一 个 空 指针 ， 表 示 链 表 的 结束 。 
我 们 把 头 指针 为 空 的 链表 定义 为 空 链表 。 图 11-9 显示 了 一 个 空 链表 的 例子 。 
空 指针 






链表 





scores 数据 链 数据 


空 链表 图 节点 


SCOTreS 





11-9 ”链表 


链表 中 的 元 素 习 惯 上 称 为 节点 ， 链 表 中 的 节点 是 至 少 包 括 两 个 域 的 记录 : 一 个 包含 数 
据 ， 男 一 个 包含 链表 中 下 一 个 节点 的 地 址 (链接 )。 图 11-9 也 显示 了 节点 。 

在 对 链表 进行 进一步 讨论 前 ， 我 们 需要 解释 一 个 在 图 11.9 中 的 记号 。 使 用 连 线 显 示 两 
个 节点 间 的 连接 。 线 的 一 端 有 一 箭头 ， 线 的 另 一 端 是 一 实心 圆 。 箭 头 表示 箭头 所 指 节点 的 地 
址 副本 。 实 心 圆 显示 了 地 址 的 副本 存储 的 地 方 (图 11-10 )。 图 11-10 中 还 显示 了 我 们 可 以 把 
地 址 的 副本 存在 多 于 一 个 的 位 置 。 例 如 ， 图 11-10 显示 了 两 个 地 址 副本 被 存储 在 两 个 不 同位 
置 。 理 解 这 些 概念 有 助 于 我 们 更 好 地 理解 链表 上 的 操作 。 


第 一 个 地 址 
的 副本 


第 一 个 副本 存 于 此 … 图 







第 二 个 副本 存 于 此 一 二 





一 个 
地 址 的 副本 


11-10 副本 和 存储 指针 的 概念 


11.3.1 数组 与 链表 


数组 和 链表 都 能 表示 内 存 中 的 数据 项 列表 。 唯 一 的 区 别 在 于 数据 项 连接 在 一 起 的 方式 。 
在 记录 数组 中 ， 连 接 工具 是 索引 。 元 素 scores[3] 与 元 素 scores[4] 相连 ， 因 为 整数 4 是 紧 跟 
在 整数 3 后 面 的 。 在 链表 中 ， 连 接 工具 是 指 
向 下 一 元 素 的 链 (指针 或 下 一 元 素 的 地 址 )。 
11-11 比较 了 5 个 整数 列表 的 两 种 表示 。 

数组 的 元 素 在 内 存 中 是 一 个 接 一 个 中 间 加 
无 间隔 存储 的 ， 即 列表 是 连续 的 。 而 链表 中 的 scores[l]| 66 
节点 的 存储 中 间 是 有 间隔 的 :节点 的 链 部 分 把 seorsD 7 

scores[3]| 74 | 

数据 项 “ 胶 ” 在 一 起 。 换 言 之 ,计算 机 可 以 选 scores[4]| 8 | 
择 连续 存储 它们 或 把 节点 分 布 在 整个 内 存 中 。 scores[5]| 9% 
这 样 有 一 个 优点 : 在 链表 中 进行 的 插入 和 删除 9) 数 组 表示 
操作 更 容易 些 ， 只 需 改变 指向 下 一 元 素 地 址 的 图 11-11 数组 与 链表 
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指针 。 但 是 ， 这 带 来 了 额外 的 开销 : 链表 的 每 个 节点 有 一 个 额外 的 域 ， 存 放 内 存 中 下 一 节点 
的 地 址 。 


11.3.2 ”链表 名 与 节点 名 

就 像 数 组 与 记录 一 样 ， 我 们 需要 区 分 链表 名 和 节点 名 (链表 中 的 元 素 )。 一 个 链表 必须 
要 有 一 个 名 字 。 

链表 名 是 头 指针 的 名 字 ， 该 头 指针 指向 表 中 第 一 个 节点 。 另 一 方面 ， 节 点 在 链表 中 并 没 
有 明显 的 名 字 ， 有 的 只 是 隐 含 的 名 字 。 节 点 的 名 字 与 指向 节点 的 指针 有 关 。 不 同 的 语言 在 处 
理 指针 与 指针 所 指 节点 间 的 关系 时 是 不 同 的 。 我 们 使 用 在 C 语言 中 使 用 的 约定 。 例 如 ， 如 
果 指 问 节 点 的 指针 称 为 p， 我 们 称 节 点 为 *p。 因 为 节点 是 一 记录 ， 我 们 能 使 用 节点 的 名 字 来 
存 取 节 点 中 的 域 。 例 如 ， 指 针 p 所 指 节点 的 数据 部 分 和 链 部 分 分 别 为 (*p).data 和 (*p).link。 
这 种 命名 约定 隐 含 着 一 个 节点 可 以 有 多 于 一 个 的 名 字 。 图 11-12 显示 了 链表 名 和 节点 名 。 


ro (*cur).link 


*#SCOreS 本 CUT 





SCOITCS 


'. 
So oe 
. 


(*scores).data (*scores).link 
cur 


图 11-12 链表 名 与 节点 名 


11.3.3 ”链表 操作 

我 们 为 数组 定义 的 操作 同样 可 以 应 用 于 链表 。 

1. 查找 链表 

链表 的 查找 算法 只 能 是 顺序 的 (参见 第 8 章 )， 因 为 链表 中 的 节点 没有 特定 的 名 字 (不 像 
数组 中 的 元 素 )， 这 个 名 字 可 以 通过 折 半 查找 找到 。 但 是 ， 既 然 链表 中 的 节点 没有 名 字 ， 那 
我 们 使 用 两 个 指针 : pre( 先 前 的 ) 和 cur (当前 的 )。 

在 查找 开始 时 ，pre 指针 为 空 ，cur 指针 指向 第 一 个 节点 。 查 找 算法 向 表 的 尾部 方向 移动 
两 个 指针 。 图 11-13 显示 了 在 极端 情况 下 这 两 个 指针 在 表 中 的 移动 ， 这 种 极端 情况 是 : 目标 
值 比 表 中 任何 值 都 大 。 例 如 ， 在 5 个 节点 的 表 中 ， 假定 目 标 值 是 220， 它 比 表 中 任何 值 都 大 。 





图 11-13 查找 链表 时 pre 和 cur 指针 的 移动 
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但 是 ， 可 能 发 生 其 他 情况 ， 如 目标 值 可 能 会 比 第 一 个 节点 中 的 数据 值 小 ， 或 者 等 于 某 个 
节点 中 的 数据 值 等。 但 是 ， 在 所 有 情况 下 ， 当 查找 结束 时 ，cur 指针 指向 停止 查找 的 节 扣 ， 
pre 指针 指向 先前 的 节点 。 如 果 目 标 被 找到 ，cur 指针 指向 含有 目标 值 的 节点 ; 如 果 目 标 未 找 
到 ，cnur 指针 指向 一 个 值 大 于 目标 值 的 节点 。 换 言 之 ， 既 然 表 是 有 序 的 ， 可 能 很 长 ， 所 以 如 
果 我 们 坚信 传递 了 目标 值 ， 那 我 们 永远 不 允许 两 个 指针 达到 表 的 末端 。 查 找 算法 使 用 一 个 标 
记 (一 个 只 能 取 真 值 或 假 值 的 变量 )。 当 目标 被 找到 时 ， 标 记 设 为 真 ; 当 目 标 未 找到 时 ， 标 记 
设 为 假 。 当 标记 为 真 时 ，cur 指针 指向 目标 值 ; 当 标记 为 假 时 ，cur 指针 指向 比 目 标 值 大 的 值 。 

图 11-14 显示 了 一 些 不 同 的 情况 。 在 第 一 种 情况 中 ， 目 标 是 98。 这 个 值 在 表 中 不 存在 ， 
而 且 比 表 中 任何 值 都 小 。 所 以 当 pre 是 空 ，cur 指向 第 一 个 节点 时 ， 算 法 就 停止 了 。 因 为 值 
未 找到 ， 所 以 标记 的 值 为 假 。 在 第 二 种 情况 中 ， 目 标 是 132; 它 是 第 二 个 节点 的 值 。 当 cur 
指针 指向 第 二 个 节点 ，pre 指针 指向 第 一 个 节点 时 ， 算 法 停止 了 。 因 为 目标 被 找到 ， 所 以 标 
记 的 值 为 真 。 在 第 三 种 和 第 四 种 情况 中 ， 目 标 都 没有 找到 ， 所 以 标记 的 值 为 假 。 


Ra 
ist 
情况 ! 
Pre Cur 
标记 ; rue 
list 1 
情况 2 


pre cur 


list 9 
Ya 轿 一 [去 量 一 [ EO 


pre cur 
标记 : flse 
list ， 
情况 4 国王 10 国王 [3232. 20 国 : 
6 四 
pre CUT 
图 11-14 不 同情 况 下 pre 和 cur 指针 的 值 
算法 11.3 显示 了 查找 的 简化 算法 。 我 们 在 while 循环 中 需要 更 多 的 条 件 ， 但 我 们 把 这 
些 留 给 了 链表 更 高 级 的 讨论 。 注 意 我 们 是 如 何 向 前 移动 两 个 指针 的 。 在 每 一 步 移 动 中 ， 我 
们 有 : 
pre ~ cur 和 cur 4 一 (*cur) .link 
这 保证 了 两 个 指针 一 起 移动 。 第 一 个 赋值 形成 cur 的 副本 ,并 把 它 保存 在 pre 中 ， 这 意 
味 着 pre 取 的 是 cur 的 先前 的 值 。 在 第 二 个 赋值 中 ，cur 所 指 的 节点 被 选择 ， 它 的 链 域 的 值 
被 复制 ， 存 储 在 cur 中 (参见 图 11-12 ) 。 查 找 算 法 被 插入 算法 (如 果 目 标 未 找到 ) 和 删除 算 
法 (如 果 目 标 找到 ) 使 用 。 
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算法 11.3 ”查找 链表 


算法 : SearchLinkedList 

目的 : 使 用 两 个 指针 pre 和 cur 查找 链表 
前 提 : 链表 ( 头 指 针 ) 和 目标 值 

后 续 ; 无 

返回 : pre 和 cur 指针 的 位 置 和 标记 的 值 


pre +— null 
SUE <— L189t 
while (target < (*Cur) ,data) 
{ 
DTI: $F” CU 
CUF $= (WUD).En 


} 
if ((*cur) .data = target) flag 人 二 true 


else flag + false 
} 


2. 插 人 节点 

在 插入 链表 之 前 ， 我 们 首先 要 使 用 查找 算法 。 如 果 查 找 算法 的 返回 值 为 假 ， 将 允许 插 
; 否则 终止 插入 算法 ， 因 为 我 们 不 允许 重复 值 的 数据 。 可 能 会 发 生 以 下 4 种 情况 : 

。 在 空 表 中 插入 。 

。 在 表 的 开始 处 插入 。 

。 在 表 的 末尾 插 人 。 

。 在 表 中 间 插 入 。 

插入 空 表 

如 果 表 是 空 (list=null)， 新 数据 项 被 作为 第 一 个 元 素 插 入 。 一 条 语句 能 做 这 工作 : 


list 二 new 


开始 处 插入 
如 果 查 找 算法 返回 的 标记 为 假 ，pre 指针 的 值 为 空 ， 那 数据 就 需要 插 在 表 的 开始 处 。 需 


要 两 条 语句 来 做 这 工作 : 

(*new) .link <— cur 和 list 二 new 

第 一 条 赋值 语句 使 得 新 节点 成 为 原先 第 一 个 节点 的 前 驱 。 第 二 条 语句 使 得 新 连接 的 节点 
成 为 第 一 个 节点 。 图 11-15 显示 了 这 种 情况 。 


Cur <— (+new).link 


Fa 





list <— new 





结 | 
图 11-15 在 链表 开始 处 插入 节点 
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末尾 处 插入 
如 果 查 找 算法 返回 的 标记 为 假 ，cur 指针 的 值 为 空 ， 那 数据 就 需要 插 在 表 的 末尾 。 和 需要 
两 条 语句 来 做 这 工作 : 


(*pre) .1ink 二 new 和 (*new) .link 人 一 null 


第 一 条 赋值 语句 把 新 节点 与 原先 最 末节 点 连接 在 一 起 。 第 二 条 语句 把 新 连接 的 节点 变 成 
最 末节 点 。 图 11-16 显示 了 这 种 情况 。 


查找 后 (*pre).link <— new (*new).link <— null 





图 11-16 在 链表 末尾 处 插入 节点 


中 间 插 入 
如 果 查 找 算法 返回 的 标记 值 为 假 ， 两 个 指针 都 不 为 空 ， 那 新 数据 就 需要 插 在 表 的 中 间 。 
需要 两 条 语句 来 做 这 工作 ; 


(*new) .link <— cur 和 (*pre) .link + 一 new 


第 一 条 赋值 语句 把 新 节点 与 它 的 后 继 连 接 在 一 起 。 第 二 条 语句 把 新 节点 与 它 的 前 驱 连接 
在 一 起 。 图 11-17 显示 了 这 种 情况 。 





201 | 
图 11-17 在 链表 中 间 插 入 节点 
算法 11.4 显示 了 在 链表 中 插入 一 个 新 节点 的 伪 代 码 。 其 中 第 一 段 是 给 一 空 表 插 入 节点 。 
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算法 11.4 ”在 链表 中 插入 节点 
算法 ; InsertLinkedList (list, target, new) 


目的 : 在 查找 链表 找到 合适 位 置 后 ， 在 链表 中 插入 节点 
前 提 : 链表 和 要 插入 的 目标 数据 


: 无 
返回 : 新 链表 


| 
searchlinkedlist (list, target, pre, cur, flag) 
// Given target and returning pre, cur, and flag 
if (flag = true) // No duplicate 
{ 


return list 


} 
if (list = null) | // Insert into empty list 


{ 
11.8t: *= new 


} | 
if (pre = null) // Insertion at the beginning 


! 
(*new) ,link 4 cur 
list + 一 new 
return list 


} 


if (cur = nul]l) // Insertion at the end 


{ 
(*pre) .link + 一 new 
(*new) .link <— null 
return list 


} 
(*new) .link <— cur // Insertion in the middle 


(*pre) .link ~ new 
return list 
} 


3. 删除 节点 

在 链表 中 删除 节点 之 前 ， 我 们 要 先 应 用 查找 算法 。 如 果 查 找 算 法 返回 的 标记 是 真 (节点 
找到 )， 我 们 可 以 从 链表 中 删除 该 节点 。 但 是 ， 删 除 操作 比 插入 操作 简单 些 ， 因 为 我 们 只 要 
两 种 情况 :删除 首 节点 和 删除 其 他 任何 节点 。 换 言 之 ， 删 除 末节 点 和 删除 中 间 节 点 可 以 由 同 
一 过 程 完成 。 

删除 首 节点 

如 果 pre 指针 为 空 ， 首 节点 将 被 删除 。cur 指针 指向 首 节点 ， 删 除 由 一 条 语句 完成 : 

14st 4— {#*cur) .link 

该 语句 把 第 二 个 节点 与 表 指针 连接 在 一 起 ， 这 意味 着 首 节点 被 删除 。 图 11-18 显示 了 这 
种 情况 。 

删除 中 间或 末尾 节点 

如 果 两 个 指针 都 不 为 空 ， 那 要 删除 的 节点 或 者 是 中 间 节 点 ， 或 者 是 末尾 节点 。cur 指针 
指向 相应 的 节点 ， 可 以 通过 一 条 语句 完成 删除 : 


(*pre) .link  (*CUI) .link 


该 语句 把 后 继 节 点 与 前 驱 节点 连接 在 一 起 ， 这 意味 着 当前 节点 被 删除 。 图 11-19 显示 了 
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这 种 情况 。 


查找 后 list <— (*cur).link 





11-18 删除 链表 中 的 首 节点 


查找 后 (*pre).link < 一 (*cur).link 





图 11-19 在 链表 中 间或 未 尾 删除 节点 


算法 11.5 显示 了 删除 节点 的 伪 代 码 。 算 法 比 插入 一 条 语句 要 简单 ， 我 们 只 要 两 种 情况 ， 
每 种 情况 只 需 一 条 语句 。 


算法 11.5 ”在 链表 中 删除 节点 


: DeleteLinkedList(1list,target) 

: 在 查找 链表 找到 正确 节点 后 ， 在 链表 中 删除 节点 
: 链表 和 要 删除 的 目标 数据 ， 

: 无 

: 新 链表 


// Given target and returning pre, cur, and flag 
searchlinkedlist (list, target, pre, cur, flag) 
if (flag = false) 

{ 
return list // The node to be deleted not found 


) 
if (pre = null) // Deleting the first node 
{ 

LSt. t= (*eUr) slink 

return list 


} 
(*Pre) ,IIink t 一 (*Ccur), link // Deleting other nodes 


return list 
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4. 检索 节点 

检索 就 是 为 了 检查 或 复制 节点 中 所 含 数据 的 目的 而 随机 访问 节点 。 在 检索 之 前 ， 链 表 需 
要 被 查找 。 如 果 找 到 数据 ， 那 它 被 检索 ， 否 则 过 程 终 止 。 检 索 只 使 用 cur 指针 ， 它 指向 被 查 
找 算法 找到 的 节点 。 算 法 11.6 显示 了 检索 节点 中 的 数据 的 伪 代 码 。 该 算法 比 插入 和 删除 算 
法 简单 得 多 。 


算法 11.6 ”在 链表 中 检索 节点 


算法 ; RetrieveLinkedList (list,target) 
目的 : 在 查找 链表 找到 正确 节点 后 ， 在 节点 中 检索 数据 
前 提 : 链表 ( 头 指 针 ) 和 要 检索 的 目标 数据 
后 续 ; 无 
返回 : 返回 检索 到 的 数据 
{ 
searchlinkedlist(list, target, pre, cur, flag) 
if (flag = false) // The node not found 
{ 
return error 
} 
return (*cur) .data 


} 


5. 遍历 链表 

为 了 遍历 链表 ， 我 们 需要 一 个 “步行 ”指针 ， 当 元 素 被 处 理 时 ， 它 从 一 个 节点 移 到 另 一 
个 节点 。 开 始 坎 历时， 我 们 把 步行 指针 指向 链表 中 的 首 节点 ， 然 后 使 用 循环 ， 直 到 所 有 数据 
都 被 处 理 。 每 次 循环 处 理 当前 节点 ， 然 后 把 步行 指针 指向 下 一 个 节点 。 当 最 后 一 个 节点 被 处 
理 完 时 ， 步 行 指针 变 为 空 ， 循 环 终 止 (图 11-20 )。 


11-20 遍历 链表 


算法 11.7 显示 了 遍历 链表 的 伪 代 码 。 
算法 11.7 人 遍历 链表 


算法 ; TraverseLinkedList (list) 
目的 : 遍历 链表 ， 处 理 每 个 数据 项 
前 提 : 链表 ( 头 指针 ) 
后 续 ; 无 
返回 : 甫 
{ 
walker -~ list 
while (walker A null) 
{ 
Process (*walker) .data 
walker +- (*walker) .link 
) 
return list 
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11.3.4 ”链表 的 应 用 

当 需 要 对 存储 数据 进行 许多 插入 和 删除 时 ， 链 表 是 一 种 非常 高 效 的 数据 结构 。 链 表 
是 一 种 动态 的 数据 结构 ， 其 中 表 从 没有 节点 开始 ， 然 后 当 需 要 新 节点 时 ， 它 就 逐渐 增 
长 。 与 数组 的 情况 相 比 ， 节 点 很 容易 被 删除 ， 不 需要 移动 其 他 节点 。 例 如 ， 链 表 可 以 
应 用 于 包含 学 校 学 生 的 记录 。 每 季 或 每 学 期 ， 新 生 进 入 学 校 ， 而 有 些 学 生 离 开 学 校 或 


毕业 。 
链表 可 以 无 限 增长 ， 也 可 以 缩短 为 空 表 。 额 外 的 开销 是 为 每 个 节点 含有 一 个 额外 的 域 。 


但 是 对 于 需要 经 常 查找 的 数据 来 说 ， 链 表 不 是 一 个 好 的 候选 者 。 这 就 陷入 了 进退 两 难 的 境 
地 ， 因 为 每 个 删除 或 插 和 人 操作 都 需要 查找 。 在 下 一 章 中 ， 我 们 可 以 看 到 一 些 抽 象 数据 类 型 ， 
它们 既 有 数组 对 于 查找 的 优点 ， 也 有 链表 对 于 插 人 和 删除 的 优点 。 


四 人 党 要 大 是 站 撒 公 和 和 本 仁 当 色 加 央 合计 的 区 榴 ， 但 坟 个 全 表 比 碍 找 一 个 
组 要 慢 。 


11.4 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
e。 Gilberg, R. and Forouzan, B. Data Structures-4 Pseudocode Approach with C, Boston, 


MA: Course Technology, 2005 
e。 Goodrich, M. and Tamassia, R. Data Structures and ga in Java, New York: 


Wiley, 2005 
®。 Neapolitan, R. and Naimipour, K. Foundations of Algorithms Using C++ Pseudocode, 


Sudbury, MA: Jones and Bartlett, 2004 
e。 Main, M. and Savitch, W. Data Structures and Other Objects Using C++, Reading, MA: 


Addison-Wesley, 2004 
se Standish, T. Data Structures, Algorithms, and Software Principles, Reading, MA: Addison- 


Wesley, 1994 


关键 术语 

array(〈 数 组 ) null pointer ( 空 指 针 ) 
column-major storage ( 列 主 序 存储 ) one-dimensional array (一 维 数组 ) 
data structure (数据 结构 ) pointer (指针 ) 

field( 域 ) record (记录 ) 

index《〈 索 引 ) retrieval (检索 ) 

link ( 链 ) row-major storage( 行 主 序 存储 ) 
linked list (链表 ) searching (查找 ， 搜 索 ) 
multidimensional array (多 维 数组 ) two-dimensional array (二 维 数 组 ) 


node (节点 ) string (字符 串 ) 


发 拘 纤 蕴 





小 结 

。 数据 结构 使 用 相关 变量 的 集合 ， 这 些 变量 可 以 被 单独 存 取 或 被 整体 存 取 。 换 言 之 ， 数 
据 结构 表示 一 组 共享 指定 关系 的 数据 项 。 在 本 章 中 ， 我 们 讨论 了 三 种 数据 结构 : 数 
组 、 记 录 和 和 链表。 

。 数组 是 通常 具有 相同 类 型 的 元 素 的 顺序 集合 。 使 用 索引 访问 数组 中 的 元 素 。 在 数组 
中 ， 有 两 种 不 同类 型 的 标识 符 : 数组 的 名 字 和 每 个 元 素 的 名 字 。 

。 许 多 应 用 需要 数据 以 多 于 一 维 的 形式 存储 。 一 个 常见 的 例子 是 表 ， 它 是 由 行 和 列 
构成 的 数组 。 二 维 数组 在 内 存 中 可 以 使 用 行 主 序 存储 或 列 主 序 存储 ， 第 一 种 更 为 
常见 。 

。 作 为 一 种 结构 的 数组 上 的 常见 操作 有 : 查找 、 插 入 、 删 除 、 检 索 和 遍历 。 当 考 除 和 插 
入 的 量 较 小 ， 而 需要 大 量 的 查找 和 检索 时 ， 数 组 是 一 种 合适 的 结构 。 数 组 通常 是 一 种 
静态 数据 结构 ， 所 以 当 数 据 项 的 数目 固定 时 ， 数 组 就 更 为 合适 。 

。 记录 是 一 个 相关 元 素 的 集合 ， 这 些 元 素 可 能 是 不 同 的 类 型 ， 但 整个 记录 有 一 个 名 称 。 
记录 中 的 每 个 元 素 称 为 一 个 域 。 域 是 记录 中 有 意义 的 命名 数据 的 最 小 元 素 。 

。 字符 串 是 字符 的 集合 ， 在 某 些 语言 中 作为 数组 被 使 用 ， 而 在 另 一 些 语言 中 作为 一 种 数 
据 结构 。 

。 链表 是 一 个 有 序数 据 的 集合 ， 其 中 每 个 元 素 包 含 下 一 个 元 素 的 位 置 (地 址 )。 每 个 元 
素 包含 两 个 部 分 : 数据 和 链 。 数 据 部 分 含有 有 用 的 信息 : 要 处 理 的 数据 。 链 用 于 将 数 
据 链 在 一 起 。 

。 为 数组 定义 的 操作 都 可 以 应 用 于 链表 。 当 数据 将 要 进行 大 量 的 插入 和 删除 时 ， 链 表 是 
非常 高 效 的 结构 。 链 表 是 一 种 动态 的 数据 结构 ， 其 中 表 可 以 从 无 节点 开始 ， 当 需 要 新 
的 节点 时 ， 表 逐渐 增长 。 


11.5 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建 议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q11-1 给 出 数据 结构 的 三 种 类 型 名 称 。 

Q11-2 ”数组 元 素 和 记录 元 素 的 区 别 是 什么 ? 
Q11-3 ”数组 元 素 和 链表 元 素 的 区 别 是 什么 ? 
Q11-4 ”为 什么 用 索引 而 不 是 下 标 来 标注 数组 元 素 ? 
Q11-5 ”数组 元 素 在 内 存 中 如 何 存 储 ? 

Q11-6 ”记录 中 域 的 定义 是 什么 ? 

Q11-7 在 链表 中 节点 的 域 是 什么 ? 

Q11-8 ”链表 中 指针 的 功能 是 什么 ? 

Q11-9 ”如 何 指向 链表 中 的 第 一 个 节点 ? 

Q11-10 ”链表 中 最 后 一 个 节点 的 指针 指向 什么 ? 
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练习 题 


P11-1 


P11-2 


P11-3 
P11-4 
P11-5 
P11-6 
P11-7 


P11-8 
P11-9 
P11-10 
P11-11 
P11-12 
P11-13 
P11-14 
P11-15 
P11-16 
P11-17 
P11-18 
P11-19 


两 个 数组 A 和 B， 各 有 10 个 整数 ， 要 求 测试 数组 A 中 每 个 元 素 是 否 与 数组 B 中 对 应 元 素 相 


等 ， 写 出 该 算法 。. 
写 出 一 个 算法 ， 要 求 倒序 排列 数组 中 元 素 ， 即 最 后 一 个 变 成 第 一 个 ， 倒 数 第 二 个 成 为 第 二 个 ， 


以 此 类 推 。 
写 出 一 个 算法 ， 要 求 打 印 出 具有 及 行 和 C 列 的 二 维 数组 中 的 内 容 。 
写 出 一 个 算法 ， 在 具有 N 个 元 素 的 数组 上 应 用 顺序 查找 。 
写 出 一 个 算法 ， 在 具有 N 个 元 素 的 数组 上 应 用 折 半 查找 。 
写 出 一 个 算法 ， 在 有 序 的 数组 中 插入 一 个 元 素 ， 算 法 必须 调用 查找 算法 找到 插入 的 位 置 。 
写 出 一 个 算法 ， 在 有 序 的 数组 中 删除 一 个 元 素 ， 算 法 必须 调用 查找 算法 找到 插入 的 位 置 。 
写 出 一 个 算法 ， 给 数组 中 的 每 个 元 素 乘 以 一 个 常数 。 
写 出 一 个 算法 ， 要 求 将 一 分 数 (Frl ) 加 到 另 一 分 数 (Fr2 ) 上 。 
写 出 一 个 算法 ， 要 求 从 一 分 数 (Fr2 ) 中 减 去 另 一 分 数 (Frl )。 
写 出 一 个 算法 ， 要 求 一 分 数 (Frl ) 乘 以 另 一 分 数 (Fr2 ) 。 
写 出 一 个 算法 ， 要 求 用 分 数 (Fr2 ) 除 分 数 (Frl )。 
画 出 一 个 示意 图 ， 显 示 数 据 部 分 是 学 生 记 录 的 链表 ， 记 录 中 有 标识 (id)、 姓 名 ( name) 和 成 
绩 (grade)。 
显示 链表 的 删除 算法 ( 11.3.3 节 中 的 算法 11.4 ) 是 如 何 删除 链表 中 唯一 的 一 个 节点 的 。 
显示 链表 的 插入 算法 ( 11.3.3 节 中 的 算法 11.3 ) 是 如 何在 空 链表 中 插入 一 个 节点 的 。 
显示 我 们 如 何 使 用 插入 算法 ( 11.3.3 节 中 的 算法 11.3 ) 从 零 开始 建立 一 链表 。 
写 一 个 算法 , 求 出 数字 链表 中 数字 的 平均 数 。 
如 果 我 们 对 图 11-9 的 链表 应 用 下 列 语句 ， 将 会 发 生 什么 ? - 


Scores 一 (*scores) .link 


如 果 我 们 对 图 11-13 的 链表 应 用 下 列 语句 ， 将 会 发 生 什 么 ? 


CUr 4— (*cur) .link 和 Pre + (*pre) .link 
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抽象 数 据 类 型 


在 这 一 章 中 ， 我 们 讨论 抽象 数据 类 型 (ADT)， 这 是 一 种 比 我 们 在 第 11 章 所 讨论 的 数据 
结构 处 于 更 高 抽象 层 的 数据 类 型 。ADT 使 用 数据 结构 来 实现 。 在 本 章 的 开始 首先 对 抽象 数 
据 类 型 做 一 个 简短 的 背景 介绍 ， 然 后 给 出 定义 并 提出 模型 。 接 着 讨论 各 种 不 同 的 抽象 数据 类 
型 ， 例 如 ， 栈 、 队 列 、 广 义 线性 表 、 树 、 二 叉 树 、 二 叉 搜 索 树 和 图 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 说 明 抽象 数据 类 型 (ADT) 的 概念 ; 

。 说明 栈 、 栈 上 的 基本 操作 、 它 们 的 应 用 以 及 它们 是 如 何 实现 的 ; 

。 说 明 队 列 、 队 列 上 的 基本 操作 、 它 们 的 应 用 以 及 它们 是 如 何 实现 的 ; 

。 说明 广义 线性 表 、 广 义 线性 表 上 的 基本 操作 、 它 们 的 应 用 以 及 它们 是 如 何 实现 的 ; 

。 说明 一 般 的 树 及 其 应 用 ; 

。 说明 二 叉 树 (一 种 特殊 的 树 ) 及 其 应 用 ; 

。 说 明 二 又 搜索 树 (BST) 及 其 应 用 

。 说明 图 及 其 应 用 。 


12.1 背景 


使 用 计算 机 进行 问题 求解 意味 着 处 理 数据 。 为 了 处 理 数据 ， 我 们 需要 定义 数据 类 型 和 
在 数据 上 进行 的 操作 。 例 如 ， 要 求 一 个 列表 中 的 数字 之 和 ， 我 们 应 该 选择 数字 的 类 型 ( 整 
数 或 实数 ) 和 定义 运算 (加 法 )。 数 据 类 型 的 定义 和 应 用 于 数据 的 操作 定义 是 抽象 数据 类 型 
(ADT) 背后 的 一 部 分 概念 ， 以 隐藏 数据 上 的 操作 是 如 何 进 行 的 。 换 言 之 ，ADT 的 用 户 只 需 
要 知道 对 数据 类 型 可 用 的 一 组 操作 ， 而 不 需要 知道 它们 是 如 何 应 用 的 。 


12.1.1 简单 抽象 数据 类 型 


许多 编程 语言 已 经 定义 了 一 些 简单 的 抽象 数据 类 型 作为 语言 的 组 成 部 分 。 例 如 ，C 语言 
定义 了 称 为 整数 的 简单 抽象 数据 类 型 。 这 种 类 型 的 抽象 数据 类 型 是 带 有 预先 定义 范围 的 整 
数 。C 还 定义 了 可 以 在 这 种 数据 类 型 上 应 用 的 用 种 操作 〔 加 、 减 、 乘 、 除 等 )。C 显 式 地 定 
义 了 整数 上 的 这 些 操作 和 我 们 期 望 的 结果 。 写 C 程序 来 进行 两 个 整数 相 加 的 程序 员 应 该 知 
道 整数 的 抽象 数据 类 型 和 可 以 应 用 于 该 抽象 数据 类 型 的 操作 。 

但 是 ， 程 序 员 不 需要 知道 这 些 操作 是 如 何 实现 的 。 例 如 ， 程 序 员 使 用 表达 式 zx + y， 
希望 x 的 值 (整数 ) 被 加 到 y 的 值 (整数 ) 上 。 结 果 被 命名 为 z (整数 )。 程 序 员 不 需要 知道 
加 法 是 如 何 进行 的 。 在 前 一 章 我 们 学 习 了 计算 机 是 如 何 执行 加 法 运算 的 ， 把 两 个 整数 以 补 的 
格式 存储 在 内 存 地 址 中 ， 把 它们 装 人 CPU 的 寄存 器 中 ， 进 行 二 进 制 相 加 ， 把 结果 回 存 到 另 
一 个 内 存 地 址 中 。 但 是 ， 程 序 员 不 必 知 道 这 些 。C 语言 中 的 整数 就 是 一 个 带 有 预定 义 操作 的 
简单 抽象 数据 类 型 。 程 序 员 不 必 关注 操作 是 如 何 进行 的 。 
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12.1.2 复杂 抽象 数据 类 型 

几 种 简单 的 抽象 数据 类 型 (如 整数 、 实 数 、 字 符 、 指 针 等 ) 已 经 被 实现 ， 在 大 多 数 语 言 
中 它们 对 用 户 是 可 用 的 。 但 是 许多 有 用 的 复杂 抽象 数据 类 型 却 没有 实现 。 就 像 我 们 在 这 一 和 草 
中 将 要 看 到 的 ,我 们 需要 表 抽 象 数据 类 型 、 栈 抽象 数据 类 型 、 队 列 抽象 数据 类 型 等 。 要 提高 
效率 ， 应 该 建立 这 些 抽象 数据 类 型 ， 将 它们 存储 在 计算 机 库 中 ， 以 便 使 用 。 例 如 ， 表 的 使 用 
者 只 需要 知道 该 表 上 有 了 哪些 可 用 的 操作 ， 而 不 需要 知道 这 些 操作 是 如 何 进行 的 。 

因此 ， 对 于 一 个 ADT， 用 户 不 用 关心 任务 是 如 何 完成 的 ， 而 是 关心 能 做 什么 。 换 言 之 ， 
ADT 包含 了 一 组 允许 程序 员 使 用 的 操作 的 定义 ， 而 这 些 操作 的 实现 是 隐藏 的 。 这 种 不 需 详 
细 说 明 实 现 过 程 的 泛 化 操作 称 为 抽象 。 我 们 抽取 了 过 程 的 本 质 ， 而 隐藏 了 实现 的 细 市 。 


抽象 概念 意味 着 : 
1. 知道 一 个 数据 类 型 能 做 什么 。 
2. 如 何 去 做 是 隐藏 的 。 


12.1.3 定义 
让 我 们 正式 地 定义 抽象 数据 类 型 。 抽 象 数据 类 型 就 是 与 对 该 数据 类 型 有 意义 的 操作 封 疾 
在 一 起 的 数据 类 型 。 然 后 ， 用 它 封装 数据 和 操作 并 对 用 户 隐 藏 。 


抽象 数据 类 型 ; 
1. 数据 的 定义 。 
2. 操作 的 定义 。 
3. 封装 数据 和 操作 。 


12.1.4 抽象 数据 类 型 的 模型 

抽象 数据 类 型 的 模型 如 图 12-1 所 示 。 图 中 不 规则 轮廓 中 的 阴影 区 域 表 示 模 型 。 在 这 个 
抽象 区 域内 部 是 该 模型 的 两 个 部 分 : 数据 结构 和 操作 (公有 的 和 私有 的 )。 应 用 程序 只 能 通 
过 接口 访问 公有 操作 。 接 口 是 公 有 操作 和 将 数据 传 给 这 些 操 作 或 从 这 些 操 作 返 回 的 列表 。 私 
有 操作 是 抽象 数据 类 型 内 部 用 户 使 用 的 。 数 据 结构 (如 数组 ;链表 ) 在 抽象 数据 类 型 里 面 ， 
被 公有 和 私有 操作 使 用 。 











公有 操作 私有 操作 





接口 


好 BL 
数据 结构 


图 12-1 ADT 模型 
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虽然 公有 操作 和 接口 应 该 独立 于 实现 ， 但 私有 操作 依赖 于 抽象 数据 类 型 实现 时 所 选择 的 
数据 结构 。 当 我 们 讨论 某 些 抽象 数据 类 型 时 ， 将 详细 说 明 这 个 问题 。 


12.1.5 实现 


计算 机 语言 不 提供 抽象 数据 类 型 包 。 要 使 用 抽象 数据 类 型 ， 首 先 要 实现 它们 ， 把 它们 存 
储 在 库 中 。 本 章 主要 介绍 一 些 常见 的 抽象 数据 类 型 及 其 应 用 。 但 是 ， 我 们 也 为 对 此 有 兴趣 的 
读者 提供 了 每 个 抽象 数据 类 型 实现 的 简单 讨论 。 我 们 把 实现 的 伪 码 算法 作为 挑战 练习 。 


12.2 栈 


栈 是 一 种 限制 线性 表 ， 该 类 列表 的 添加 和 删除 操作 只 能 在 一 端 实现 ， 称 为 “ 栈 顶 ”。 如 
果 将 一 系列 数据 插入 栈 中 ， 然 后 移 走 它们 ， 那 么 数据 的 顺序 将 被 倒转 。 数 据 插 入 时 的 顺序 为 
5，10，15，20， 移 走 后 顺 序 就 变 成 20，15，10，5。 这 种 倒转 的 属性 也 正 是 栈 被 称 为 后 进 
先 出 (LIFO) 数据 结构 的 原因 。 

人 们 在 日 常生 活 中 使 用 不 同类 型 的 栈 ， 比 如 说 一 堆 硬币 或 一 堆 书 。 任 何 只 能 在 顶部 添加 
或 移 除 物体 的 情况 都 是 栈 。 如 果 想 移 除 任 何不 是 顶部 的 物体 ， 则 首先 必须 移 除 其 上 面 的 所 有 
物体 。 图 12-2 给 出 了 栈 的 三 个 示例 。 

插入 (入 栈 ) 删除 (出 栈 ) 





硬币 栈 


图 12-2 ” 栈 的 三 个 示例 


12.2.1 栈 的 操作 


尽管 栈 有 很 多 操作 ， 但 基本 操作 有 4 种 : 建 栈 、 入 栈 、 出 栈 和 空 。 下 面 定 义 它们 。 
1. 建 栈 操 作 

建 栈 操作 创建 一 个 空 栈 ， 格 式 如 下 : 

stack (stackName) 


stackName 是 要 创建 栈 的 名 字 。 这 个 操作 返回 一 个 空 


栈 。 图 12-3 显示 了 这 个 操作 的 图 形 表示 。 六 于 空 栈 


2. 人 栈 操作 
图 12.3， 建 栈 操 
入 栈 操作 在 栈 顶 添加 新 的 元 素 ， 格 式 如 下 ， 0 


push (stackName, dataItem) 

stackName 是 栈 的 名 字 ，dataItem 是 要 捅 在 栈 顶 的 数据 。 人 栈 后 ， 新 的 元 素 称 为 栈 项 元 
这 个 操作 返回 一 个 dataltem 插 在 顶端 的 新 栈 。 图 12-4 显示 了 这 个 操作 的 图 形 表 示 。 

3, 出 栈 操作 

出 栈 操作 将 栈 顶 元 素 移 走 ， 格 式 如 下 : 


pop(stackNmae, dataItem) 





- 
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12-4 人 栈 操作 


stackName 是 栈 的 名 字 ，dataltem 是 从 栈 中 移 走 的 数据 。 图 12-5 显示 了 这 个 操作 的 图 形 
表示 。 


操作 





图 12-5 出 栈 操作 


删除 的 项 可 以 被 应 用 程序 使 用 ， 也 可 以 被 丢弃 。 出 栈 操作 之 后 ， 在 删除 之 前 ， 栈 项 元 素 
下 面 的 项 就 成 为 栈 顶 元 素 。 这 个 操作 返回 一 个 少 一 个 元 素 的 新 栈 。 

4. 空 操作 

空 操 作 检 查 栈 的 状态 ， 格 式 如 下 : 


empty (stackName) 


stackName 是 栈 的 名 字 。 如 果 栈 为 空 ， 此 操作 返回 真 ; 如 果 栈 非 空 ， 返 回 假 。 
12.2.2 栈 的 抽象 数据 类 型 
TO SP 
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图 12-6 显 示 了 在 栈 S 上 应 
用 先前 定义 的 操作 的 算法 片段 。 第 4 个 操作 在 
试图 弹出 栈 顶 元 素 前 检查 栈 的 状态 ， 栈 项 元 素 
的 值 存储 在 变量 x 中 ， 但是， 我 们 并 没有 使 用 
这 个 值 ， 它 将 在 算法 结束 时 自动 被 丢弃 。 


12.2.3 栈 的 应 用 





er 
栈 的 应 用 可 分 为 4 大 类 : 倒转 数据 、 配 图 12-6 例 12-1 
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对 数据 、 数 据 延 迟 使 用 和 回溯 步骤 。 下 面 我 们 讨论 前 面 的 两 种 。 

1. 倒转 数据 

倒转 数据 需要 一 组 给 定 的 数据 项 ， 重 新 排序 ， 使 得 首尾 元 素 互 换 ， 中 间 的 所 有 元 素 也 相 

Dt 例如 : 表 (2，4，7，1，6，8 ) 变 成 表 (8, 6, 1，7，4，2 )。 

J 在 第 2 章 (2.2.6 节 中 的 图 2-6 ) 中 ， 我 们 给 出 了 一 个 简单 的 UML 图 ， 把 一 
个 整数 从 十 进 制 转换 成 任意 进 制 。 虽然 算法 非常 简单 ， 但 如 果 打 印 它 们 创建 的 倒 排 整数 的 数 
字 ， 我 们 将 得 到 倒 排 顺序 的 数字 。 任 何 计算 机 语言 中 的 打印 指令 都 是 从 左 到 右 打 印字 符 的 ， 
但 算法 是 从 右 到 左 建立 数字 的 。 我 们 使 用 栈 的 倒转 特性 (LIFO 结构 ) 来 解决 这 个 问题 。 

算法 12.1 显示 了 把 十 进 制 转化 为 二 进 制 和 打印 结果 的 伪 代 码 。 


算法 12.1 例 12-2 





算法 : DecimalToBinary (number) 

目的 : 打印 与 给 定 的 整数 (绝对 值 ) 等 价 的 二 进 制 数 
前 提 : 给 出 要 转化 的 整数 (数字 ) 

后 续 : 二 进 制 整数 被 打印 

返回 : 无 


Stack (S) 
while (number 天 0) 
{ 


remainder 人 一 number mod 2 
push(S, remainder) 
number 二 number / 2 

) 

while(not empty'(S)) 

{ 
PoP (S, x) 
print(x) 

) 


return 


} 


现在 先 创建 一 个 空 的 栈 ， 然 后 使 用 while 循环 创建 二 进 制 位 ， 我 们 不 是 打印 出 它们 ， 而 
是 把 它们 压 人 栈 中 。 当 所 有 的 二 进 制 位 都 被 创建 后 ， 退 出 循环 。 现 在 我 们 使 用 另外 一 个 循环 
从 栈 中 弹出 二 进 制 位 ， 并 打印 它们 。 注 意 ， 二 进 制 位 是 按 它们 创建 的 相反 顺序 打印 出 来 的 。 

2. 配对 数据 

我 们 经 常 需要 在 表达 式 中 进行 一 些 字 符 的 配对 。 例 如 ， 当 用 计算 机 语言 写 一 个 数学 表达 
式 时 ， 我 们 经 常 使 用 括号 来 改变 运算 符 的 优先 级 。 由 于 第 二 个 表达 式 中 的 括号 ， 下 面 两 个 表 
达 式 的 计算 结果 不 同 : 

3X6+2 = 20 3X (6+2) = 24 

在 第 一 个 表达 式 中 ， 乘 法 运算 符 的 优先 级 比 加 法 的 要 高 ( 它 被 先 计算 )。 在 第 二 个 表达 
式 中 ， 括 号 忽略 了 优先 级 ， 因 此 先 计算 加 法 。 当 输入 一 个 带 有 许多 括号 的 表达 式 时 ， 我 们 经 
常 忘记 括号 的 配对 。 编 译 程序 的 一 个 作用 就 是 为 我 们 做 这 样 的 检查 。 编 译 程序 使 用 栈 来 检查 
eine sk i 
算法 12.2 显示 了 如 何 检 查 所 有 开 插 号 是 否 与 闭 括号 配对 。 
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算法 12.2 例 12-3 


算法 ， CheckingParentheses (expression) 
目的 : 检查 表达 式 中 括号 的 配对 情况 

前 提 : 给 出 要 检查 的 表达 式 

后 续 : 如 果 有 不 配对 的 括号 ， 则 给 出 错误 消息 
返回 ; 无 

{ 





stackl(S) 
whilel(more character in the expression) 
( 
Char + 一 next character 
if (Char=' (') 
{ 
push (S,Char) 
) 
else 
{ 
if (Char="')'") 
if (empty (S) ) 
{ 
print (unmatched opening Parenthesis) 
) 
else 
{ 
pop (S, x) 
) 


} 
} 
if(not empty(S) ) 


{ 
print (a closing parenthesis not matched) 


} 


return 


) 


12.2.4 栈 的 实现 


在 这 一 节 中 ， 我 们 描述 栈 抽象 数据 类 型 实现 背后 的 总 体 概念 。 在 抽象 数据 类 型 层次 上 ， 
我 们 使 用 栈 及 其 4 个 操作 (stack、push、pop 和 empty) ; 在 实现 的 层次 上 ， 我 们 需要 选择 数 
据 结构 来 实现 它们 。 栈 抽象 数据 类 型 可 以 使 用 数组 也 可 以 使 用 链表 来 实现 。 图 12-7 显示 了 
一 个 有 5 个 数据 项 的 栈 抽象 数据 类 型 的 例子 。 图 中 还 显示 了 我 们 是 如 何 实现 栈 的 。 





图 12-7 栈 的 实现 
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在 数组 实现 中 ， 我 们 有 带 有 两 个 域 的 记录 。 第 一 个 域 用 来 存储 关于 数组 的 信息 : 把 它 当 
作 计 数 域 ， 在 任何 时 刻 其 中 显示 的 是 栈 中 数据 项 的 数目 。 第 二 个 域 是 一 个 含有 栈 顶 元 素 索 引 
的 整数 。 注 意 数组 是 颠倒 显示 的 ， 这 是 为 了 与 链表 实现 相 匹配 。 

链表 的 实现 是 相似 的 : 有 一 个 具有 栈 名 字 的 额外 节点 。 这 个 节点 也 有 两 个 域 : 一 个 计数 
器 和 一 个 指 同 栈 顶 元 素 的 指针 。 

算法 

可 以 用 伪 代 码 写 出 每 种 实现 定义 的 4 种 操作 。 在 第 11 章 中 显示 了 处 理 数组 和 链表 的 算 
法 ， 这 些 算法 可 以 被 修改 成 栈 中 我 们 需要 的 4 种 算法 : stack、push、pop 和 empty。 这 些 算 
法 甚至 比 第 11 章 中 那些 算法 更 简单 ， 因 为 插 和 人 和 删除 只 在 栈 顶 进行 。 我 们 把 这 些 算法 的 编 


写 留 作 练习 。 


12.3 ”队列 
队列 是 一 种 线性 表 ， 该 表 中 的 数据 只 能 在 称 为 尾部 的 一 端 插入 ， 并且 只 能 在 称 为 头 部 的 
一 端 删 除 。 这 些 限制 确保 了 数据 在 队列 中 只 能 按照 它们 存 和 人 的 顺序 被 处 理 。 换 言 之 ， 队 列 就 


是 先进 先 出 (FIFO) 结构 。 
队列 是 日 常生 活 中 常见 的 。 一 队 在 车 站 等 公共 汽车 的 人 就 是 一 个 队列 ， 等 待 电 话 接 线 员 
回复 的 一 系列 电话 是 一 个 队列 ， 等 待 计算 机 处 理 的 一 系列 等 待 任务 也 是 一 个 队列 。 
图 12-8 给 出 了 两 个 队列 : 一 个 是 人 的 队列 ， 另 一 个 是 计算 机 队列 。 无 论 是 人 还 是 数据 ， 
都 是 从 尾部 进入 了 队列 ， 并 都 要 等 到 到 达 队 列 头 部 ( 队 首 ) 才能 被 处 理 ， 一 县 到 达 队 列 的 头 
部 ， 就 离开 队列 并 接受 服务 。 


1 外 


尾部 





人 的 队列 计算 机 队列 
图 12-8 队列 的 两 个 代表 


12.3.1 队列 的 操作 


尽管 我 们 可 以 为 队列 定义 许多 操作 ， 但 有 4 个 是 基本 的 : 建 队 列 、 入 队 、 出 队 和 空 ， 定 
义 如 下 。 

1. 建 队列 操作 

建 队列 操作 建立 一 个 空 队 列 ， 格 式 如 下 : 


queue (gueueName) 


queueName 是 建立 的 队列 的 名 字 。 这 个 操作 返回 一 个 空 队 列 。 pe 

图 12-9 显示 了 这 个 操作 的 图 形 化 表示 。 L 
2. 人 队 操 作 2 
入 队 操作 在 队列 的 尾部 插入 一 个 数据 项 ， 格 式 如 下 : 图 12-9 建 队列 操作 


enqueue ( queueName，dataItenm ) 


queueName 是 队列 的 名 字 ，dataItem 是 要 在 队列 尾部 插入 的 数据 。 人 队 操 作 后 ， 新 数据 


各 712 全 





项 就 成 了 队列 的 最 后 一 项 。 这 个 操作 返回 一 个 dataItem 插 在 队列 尾部 的 新 队列 。 图 12-10 显 
示 了 这 个 操作 的 图 形 化 表示 。 


要 入 队 的 数据 
头 部 。 尾部 





图 12-10 和 信 队 操作 


3. 出 队 操 作 
出 队 操作 删除 队列 头 部 的 数据 项 ， 格 式 如 下 : 


dequeue (queueName, dataltem) 


queueName 是 队列 的 名 字 ，dataItem 是 从 队列 中 删除 的 数据 。 被 删除 的 数据 项 可 以 被 应 
用 程序 使 用 ， 也 可 以 被 直接 丢弃 。 出 队 操作 后 ， 紧 跟 在 队 首 的 数据 项 就 成 了 队 首 元 素 。 这 个 
操作 返回 少 一 个 元 素 的 新 队列 。 图 12-11 显示 了 这 个 操作 的 图 形 化 表示 。 


出 队 的 数据 
区 头 部 尾部 
wm 5 一概 轴 一 加 可 了 
原先 的 队列 现在 的 队列 

图 12-11 出 队 操 作 





4. 空 操作 
空 操 作 检 查 队 列 的 状态 ， 格 式 如 下 : 


empty (queueName) 


queueName 是 队列 的 名 字 。 如 果 队 列 为 空 ， 则 这 个 操作 返回 真 ， 否 则 返回 假 。 


12.3.2 ”队列 的 抽象 数据 类 型 
我 们 定义 队列 | 
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图 12-12 显示 了 应 用 原先 定义 在 队列 Q 上 的 操作 的 算法 片段 。 第 4 个 操作 
在 队 首 出 队 前 检查 队列 的 状态 。 队 首 元 素 的 值 被 存储 在 变量 x 中 ， 但 是 ， 我 们 并 不 使 用 它 ， 
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在 算法 片段 结束 时 ， 它 将 被 自动 丢弃 。 


12.3.3 ”队列 的 应 用 


队列 是 最 常用 的 数据 处 理 结构 之 一 。 事 实 
上 ， 在 所 有 的 操作 系统 和 网 络 中 都 有 队列 的 身 
影 ， 在 其 他 技术 领域 更 是 数不胜数 。 例 如 ， 队 
列 应 用 于 在 线 电子 商务 应 用 程序 ， 如 处 理 用 户 需 
求 、 作 业 和 指令 。 在 计算 机 系统 中 ， 需 要 用 队列 
来 完成 对 作业 或 系统 设备 (如 打印 池 ) 的 处 理 。 
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3》 通过 数据 的 一 些 特性 ， 以 列 可 [EQ a EE 
以 用 于 组 织 数据 库 。 例如 ， 假 设 在 计算 机 中 有 算法 片段 
一 有 序 的 数据 表 ， 数据 分 成 两 类 ， 小 于 1000 图 12-12 例 12-4 


和 大 于 1000。 我 们 可 以 使 用 两 个 队列 分 隔 这 
个 类 别 ， 并 同时 维护 它们 所 在 类 别 中 的 数据 顺序 。 算 法 12.3 显示 了 这 个 操作 的 伪 代码 。 


算法 12.3 ” 例 12-5 


算法 ; Categorizer (list) 

目的 : 把 数据 分 成 两 类 ， 建 立 两 个 分 离 的 表 
前 提 : 给 定 原 始 表 

后 续 : 打印 两 个 表 

返回 : 无 


{ 


queue (Q1) 
queue (Q2) 
while (more data in the list) 
{ 
if (data < 1000) 
{ 
enqueue (Ql1, data) 
} 
if (data 之 1000) 
{ 
enqueue (Q2,，data) 
) 
} 
while (not empty(ol)) 
{ 
dequeue (Q1, x) 
print (x) 
} 
while (not empty(Q2)) 
{ 
dequeue (Q2，X) 
print (x) 
} 


return 


和 由 队列 的 另 一 个 常用 应 用 是 调节 和 建立 数据 的 快速 生成 和 缓慢 消费 间 的 平衡 。 
例如 ， 假 设 CPU 与 打印 机 相连 ， 打 印 机 的 速度 是 不 能 跟 CPU 的 速度 相 比 的 。 如 果 CPU 等 





230 觉 12 蓝 


待 打印 机 去 打印 CPU 生成 的 数据 ， 那 么 CPU 将 要 空闲 好 长 时 间 。 解 决 方法 就 是 队列 ，CPU 
生成 队列 能 容纳 的 数据 块 ， 并 把 这 些 数 据 块 放 入 队列 中 。CPU 现在 就 腾 出 来 去 做 其 他 工作 了 。 
数据 块 慢 慢 地 被 从 队列 中 取出 ， 并 慢 慢 地 被 打印 。 用 作 这 种 目的 的 队列 通常 称 为 假 脱 机 队列 。 


12.3.4 队列 的 实现 


在 抽象 数据 类 型 层次 上 ， 我 们 使 用 队列 及 其 4 个 操作 (queue、enqueue、dequeue 和 
empty) ; 在 实现 的 层次 上 ， 我 们 需要 选择 数据 结构 来 实现 它们 。 队 列 抽象 数据 类 型 可 以 使 用 
数组 或 链表 来 实现 。 图 12-13 显示 了 一 个 有 5 个 数据 项 的 队列 抽象 数据 类 型 的 例子 。 图 中 还 


显示 了 我 们 是 如 何 实现 队列 的 。 . 





count front rear 


b) 数 组 实现 





count front rear 
c) 链 表 实 现 
图 12-13 ”队列 的 实现 


在 数组 实现 中 ， 我 们 有 带 有 三 个 域 的 记录 。 第 一 个 域 用 来 存储 关于 队列 的 信息 : 把 它 当 
作 计 数 域 ， 在 任何 时 刻 其 中 显示 的 是 队列 中 数据 项 的 数目 。 第 二 个 域 是 一 个 含有 队 首 元 素 索 
引 的 整数 。 第 三 个 域 也 是 一 个 整数 ， 它 含有 队 尾 元 素 的 索引 。 

链表 的 实现 是 相似 的 : 我 们 有 一 个 有 队列 名 字 的 额外 节点 。 这 个 节点 也 有 三 个 域 : 一 个 
计数 器 、 一 个 指向 队 首 元 素 的 指针 和 一 个 指向 队 尾 元 素 的 指针 。 


算法 
可 以 用 伪 代 码 写 出 我 们 为 每 种 实现 定义 的 4 种 操作 。 在 第 11 章 中 显示 了 处 理 数 组 和 链 


表 的 算法 ， 这 些 算法 可 以 被 修改 成 队列 中 我 们 需要 的 4 种 算法 ; queue、enqueue、dequeue 
和 empty。 这 些 算 法 甚至 比 第 11 章 中 那些 算法 更 简单 ， 因 为 插入 只 在 队 尾 进行 ， 而 删除 只 
在 队 首 进 行 。 我 们 把 这 些 算法 的 编写 留 作 练习 。 


12.4 广义 线性 表 
前 两 节 中 介绍 的 栈 和 队列 都 是 限制 线性 表 。 广 义 线性 表 是 像 插 入 和 删除 等 操作 可 以 在 其 
中 任何 地 方 进行 的 表 ， 可 以 在 表 头 、 表 中 间或 表 尾 。 图 12-14 显示 了 一 个 广义 线性 表 。 





广义 线性 表 
图 12-14 广义 线性 表 
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我 们 把 广义 线性 表 定 义 成 具有 如 下 特性 的 元 素 集合 : 

。 元 素 具 有 相同 的 类 型 。 

。 元素 顺序 排列 ， 这 意味 着 有 第 一 个 元 素 和 最 后 一 个 元 素 。 

。 除 第 一 个 元 素 外 每 个 元 素 都 有 唯一 的 前 驱 ， 除 最 后 一 个 元 素 外 每 个 元 素 都 有 唯一 的 
后 继 。 

。 每 个 元 素 是 一 个 带 有 关键 字 域 的 记录 。 

。 元 素 按 关键 字 值 排序 。 


12.4.1 广义 线性 表 的 操作 


虽然 可 以 定义 许多 广义 线性 表 的 操作 ， 但 本 章 仅 讨论 6 种 常用 的 操作 ， 建 表 、 插 入 、 删 
除 、 检 索 、 人 遍历 和 空 。 

1. 建 表 操作 

建 表 操作 建立 一 个 空 表 ， 格 式 如 下 : 

TSt (listName) 

listName 是 要 建立 的 广义 线性 表 的 名 字 。 这 个 操作 返回 一 个 空 表 。 

2. 插 人 操作 

既然 我 们 假定 广义 线性 表 中 的 数据 是 已 排序 的 ， 那 么 插 和 人 就 必须 在 保持 元 素 顺序 的 方式 
下 进行 。 为 了 判定 元 素 的 插入 位 置 ， 就 需要 查找 了 。 但 是 ; 查找 是 在 实现 层次 上 进行 的 ， 而 
不 是 在 抽象 数据 类 型 层次 上 。 另 外 ， 为 了 简单 起 见 ， 我 们 假设 在 广义 线性 表 中 不 允许 重复 的 
数据 。 因 此 ， 我 们 把 元 素 插 在 能 保持 关键 字 顺 序 的 地 方 。 格 式 如 下 : 


insert (listName, element) 


图 12-15 图 形 化 地 显示 了 插入 操作 。 





30| | | 链表 





链表 (插入 前 ) jl ”HH | 


12-15 插入 操作 


3. 删除 操作 
从 广义 表 中 删除 数据 也 需要 查找 表 ， 以 找到 删除 数据 在 表 中 的 位 置 (图 12-16 )。 当 数 


据 的 位 置 被 找到 后 ， 删 除 操作 就 能 进行 了 。 格 式 如 下 : 

delete(listName, target, element) 

target 是 与 表 中 元 素 的 关键 字 具 有 相同 类 型 的 数据 值 。 如 果 关 键 字 值 与 目标 相等 的 元 素 
被 发 现 ， 这 个 元 素 将 被 删除 。 图 12-16 图 形 化 地 显示 了 删除 操作 。 

注意 ， 这 个 操作 返回 被 删除 的 元 素 ， 如 果 我 们 需要 改变 某 些 域 的 值 ， 并 把 数据 项 重新 插 
和信 表 中 ， 那 么 这 个 返回 值 就 是 需要 的 。 我 们 并 没有 在 表 上 定义 任何 改变 域 值 的 操作 。 
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要 删除 的 元 素 





链表 (删除 后 ) |0| Hl Haol |」 | 链表 


图 12-16 ”删除 操作 


4. 检索 操作 
检索 的 意思 是 单个 元 素 的 存 取 。 像 插入 和 删除 操作 一 样 ， 广 义 表 首 先 被 查找 ， 数 据 被 发 


现 ， 才 能 被 检索 。 格 式 如 下 : 

retrieve (listName, target, element) 

target 是 与 表 中 元 素 的 关键 字 具 有 相同 类 型 的 数据 值 。 图 12-17 图 形 化 地 显示 了 检索 操 
作 。 如 果 关 键 字 值 与 目标 相等 的 元 素 被 发 现 ， 这 个 元 素 的 副本 被 检索 ， 该 元 素 还 留 在 表 中 。 
剩余 的 数据 


元 表 图] 


关键 宁 值 






目标 25 A relmeve (LiST target, eile en 


链表 (检索 后 )| 四 [ ”] 欧 ] 图 加 | 
图 12-17 检索 操作 


5. 壳 爵 操作 
前 面 的 每 一 个 操作 只 涉及 表 中 的 一 个 元 素 ， 随 机 地 存 取 表 ， 而 表 的 遍历 涉及 表 的 顺序 存 


取 。 这 是 一 个 表 中 所 有 的 元 素 逐 一 被 处 理 的 操作 。 格 式 如 下 : 

traverse (listName, action) 

遍历 操作 顺序 地 存 取 表 中 元 素 ， 而 动作 指明 了 在 每 个 元 素 上 进行 的 操作 。 动 作 的 一 些 例 
子 是 打印 数据 、 在 数据 上 应 用 某 些 数学 操作 等 。 


6. 空 操作 
空 操作 检查 表 的 状态 ， 格 式 如 下 ; 


empty (listName) 


listName 是 表 的 名 字 ， 如 果 表 是 空 的 ， 该 操作 返回 真 ， 如 果 表 非 空 ， 则 返回 假 。 


12.4.2 广义 线性 表 的 抽象 数据 类 型 
广义 线性 表 的 抽象 数据 类 型 定义 如 下 : 


广义 线性 表 的 抽 杀 数据 类 型 ， 和 站 寺 a De ee ee hi 
定义: 人 人 aa 人 


> rt ee ee 
Tist: a sR 比 Sr 2 te a ES a 
L oh 。 . 和 y 和 和 Fu ue ， 和 | b v 

Ed 了 这 bi i en - 有 
Re A rt 6 te ST 和 ， 


埠 萌 履 据 炎 型 








insert; 在 表 中 插入 一 个 元 素 。 es 
“dclete; 从 表 中 删除 一 个 元 素 。 we 
retrieve: 从 表 中 检索 一 个 元 素 。 Te | 
traverse: 顺序 地 人 遍历 表 ; es a . 
二 a empty: 检查 表 的 状态 。 i 0 


图 12-18 显示 了 在 表 L 上 应 用 前 面 定义 的 操作 的 算法 片段 。 注 意 第 3 个 操 
全 村 在 了 二 靖 的 入 因为 插入 操作 调用 了 实现 层次 上 的 查找 算法 ， 找 到 了 新 数据 
应 该 被 插入 的 位 置 。 


list (L) DL 

insert (L, 10) L 

ne to) Ee 

if (not empty (L)) delete (L, 3) L 

insert (L, 6) : a 
算法 片段 





图 12-18 例 12-7 


第 4 个 操作 要 求 从 表 中 删除 数据 项 3。 它 调用 了 空 操作 来 确保 表 是 非 空 的 。 由 于 表 是 非 
空 的， 操作 可 以 进行 。 但 是 ， 当 它 调 用 实现 层次 的 查找 算法 时 ， 在 表 中 并 没有 找到 数据 项 。 
因此 ， 表 就 无 变化 地 被 返回 了 。 最 终 ， 最 后 一 个 操作 把 6 插 在 合适 的 位 置 上 。 


12.4.3 ”广义 线性 表 的 应 用 


广义 线性 表 可 应 用 于 元 素 被 随机 存 取 或 顺序 存 取 的 情况 。 例 如 ， 在 大 学 里 ， 线 性 表 可 以 
用 来 存储 每 个 学 期 人 学 的 学 生 信息 。 

0 假设 一 个 大 学 有 一 个 广义 线性 表 ， 表 中 存 有 关于 学 生 的 信息 ， 每 个 数据 元 
素 是 一 个 带 有 三 个 域 的 记录 : ID、Name 和 Grade。 算 法 12.4 显示 了 一 个 帮助 教授 修改 学 生 
成 绩 的 算法 。 删 除 操作 从 表 中 删除 一 个 元 素 ， 这 样 才 允许 程序 修改 成 绩 。 插 入 操作 把 修改 的 
元 素 插 回 表 中 。 元素 含有 学 生 的 整个 记录 ， 目 标 是 用 来 查找 表 的 ID。 


算法 12.4 例 12-8 
算法 ， ChangeGrade (StudentList, target, grade) 
目的 ; 修改 学 生 的 成 绩 
前 提 ; 给 定 学 生 表 和 成 绩 
后 续 ; 无 
返回 ; 无 


{ 
delete(StudentList, target, element) 


(element.data) .Grade -~ grade 
insert (StudentList, element) 
return 


} 
(9 毕 续 例 12-s， 假 设 辅 导 教 师 在 学 期 未 要 打印 所 有 学 生 的 记录 。 算 法 12.5 能 
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做 这 个 工作 。 
算法 12.5 ” 例 12-9 
算法 : PrintRecord(StudentList) 
目的 ， 打印 StudentList 中 的 所 有 学 生 的 记录 
前 提 : 给 定 学 生 列 表 
后 续 : 无 
返回 ; 无 


{ 
traverse (StudentList, Print) 


return 
} 


我 们 假定 有 一 个 称 为 Print 的 算法 能 打印 出 记录 的 内 容 。 对 于 每 个 节点 ， 表 遍历 调用 
Print 算法 ， 并 传递 要 打印 的 数据 给 它 。 


12.4.4 广义 线性 表 的 实现 

在 抽象 数据 类 型 层次 上 ,我 们 使 用 表 及 其 6 个 操作 (list、insert、delete、retrieve、 
traverse 和 empty) ; 在 实现 的 层次 上 ， 我 们 需要 选择 数据 结构 来 实现 它们 。 广 义 线性 表 抽 象 
数据 类 型 可 以 使 用 数组 或 链表 来 实现 。 图 12-19 显示 了 一 个 有 5 个 数据 项 的 表 抽 象 数据 类 型 
的 例子 。 图 中 还 显示 了 我 们 是 如 何 实现 表 的 。 


工大 大 大 太古] 
a) ADT 
Wi [1] [2] [3] [4] [5] [6] [7] 
-Cl EO | ~: | 
count 
b) 数 组 实现 
I 
count first : 
c) 链 表 实 现 


图 12-19 广义 线性 表 的 实现 


在 数组 实现 中 ， 我 们 有 带 有 两 个 域 的 记录 。 第 一 个 域 用 来 存储 关于 数组 的 信息 : 把 它 当 
作 计数 域 ， 其 中 显示 的 是 表 中 当前 数据 项 的 数目 。 第 二 个 域 是 一 个 含有 表 中 首 元 素 索 引 的 整 
数 。 链 表 的 实现 是 相似 的 : 我 们 有 一 个 具有 表 名 字 的 额外 节点 。 这 个 节点 也 有 两 个 域 : 一 个 
计数 器 和 一 个 指 疝 首 元 素 的 指针 。 


算法 
可 以 用 伪 代 码 写 出 每 种 实现 定义 的 6 种 操作 。 在 第 11 章 中 显示 了 处 理 数 组 和 链表 的 算 
法 ， 这 些 算法 稍 做 修改 ， 就 成 为 我 们 所 需要 的 表 的 算法 。 我 们 把 这 些 算法 的 编写 留 作 练习 。 


12.5 树 

树 包括 一 组 有 限 的 元 素 ， 称 为 节点 (或 顶点 )， 同 时 包括 一 组 有 限 的 有 向 线段 ， 用 来 连 
接 节点 ， 称 为 跑 。 如 果树 是 非 空 的 ， 其 中 有 一 个 节点 没有 进入 的 弧 ， 该 节点 称 为 根 。 树 中 的 
其 他 节点 都 可 以 沿 着 从 根 开始 的 唯一 路 径 到 达 ， 该 路 径 是 指 一 系列 相 邻 连 接 的 节点 序列 。 树 
的 结构 通常 被 画 成 上 下 颠倒 ， 根 在 顶部 ( 见 图 12-20 )。 
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图 12-20 树 的 示意 图 


我 们 可 以 把 树 中 的 顶点 分 成 三 类 : 根 、 时 子 和 内 部 节点 。 
表 12-1 显示 了 每 种 节点 允许 的 外 出 弧 和 进入 弧 的 数目 。 


表 12-1 每 种 节点 允许 的 外 出 弧 和 进入 弧 的 数目 


节点 类 型 进入 弧 外 出 弧 
可 REEITTEEEEO ET 
到 a ey Fp 


内 部 节点 | 1 或 更 多 


从 一 给 定 节点 可 以 直接 到 达 (通过 一 个 弧 ) 的 节点 称 为 子 节 点 ， 从 其 出 发 子 节点 可 以 直 
接 到 达 的 节点 称 为 双亲 。 具 有 相同 双亲 的 节点 称 为 兄弟 节点 。 节 点 的 子孙 是 指 从 该 节点 出 发 
可 以 到 达 的 所 有 节点 ， 而 从 其 出 发 所 有 的 子孙 都 可 以 到 达 的 节点 称 为 祖先 。 树 中 每 个 节点 都 
可 能 有 子 树 。 

每 个 节点 的 子 树 含有 子 节点 中 的 一 个 和 这 个 子 节点 的 所 有 子孙 。 图 12-21 显示 了 图 12-20 
中 树 的 所 有 子 树 。 





子 树 B 子 树 F 
图 12-21 子 树 


虽然 树 在 计算 机 科学 中 有 许多 应 用 ， 如 索引 文件 等 ， 但 它们 的 研究 超出 了 本 书 的 范围 。 
我 们 把 树 的 介绍 作为 一 种 特殊 的 树 一 一 二 又 树 的 前 奏 。 


12.5.1 二 叉 树 


二 叉 树 是 一 棵 树 ， 且 其 中 没有 一 个 节点 所 含有 的 子 树 的 个 数 超过 两 个 。 换 句 话 说 ， 任 一 
节点 只 能 有 0、1 或 2 棵 子 树 。 这 些 子 树 被 描述 为 左 子 树 和 右 子 树 。 图 12-22 给 出 了 一 棵 有 
两 棵 子 树 的 二 叉 树 。 注 意 每 一 棵 子 树 本 身 也 是 一 棵 二 叉 树 。 

二 义 树 的 递归 定义 

在 第 8 章 中 ， 我 们 介绍 了 算法 的 递归 定义 。 我 们 也 能 递归 定义 一 个 结构 或 一 个 抽象 数据 
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类 型 。 下 面 给 出 了 二 叉 树 的 递归 定义 。 注 意 ， 基 于 这 个 定义 ， 二 叉 树 可 以 有 一 个 根 ， 而 每 棵 
子 树 也 可 以 有 一 个 根 。 





图 12-22 二叉树 
“二 又 树 是 一 标 空 树 或 由 一 个 根 节点 和 两 棵 子 树 构成 ， 而 每 标 子 树 也 是 二 又 树 。 
图 12-23 显示 了 8 棵 树 ， 第 一 棵 是 空 二 叉 树 (有 时 称 为 零 二 叉 树 )。 


国 


图 12-23 二叉树 的 例子 





12.5.2 二叉树 的 操作 

二 叉 树 中 6 种 最 常用 的 操作 是 建树 (创建 一 棵 空 树 )、 插 入 、 删 除 、 检 索 、 空 和 遍历 ， 
前 5 种 超出 了 本 书 的 范围 。 本 节 只 讨论 二 叉 树 的 遍历 。 

二 叉 树 的 过 历 

二 又 树 遍 历 要 求 按照 预定 的 顺序 处 理 每 一 个 节点 且 仅 处 理 一 次 。 两 种 常用 的 遍历 次 序 是 
深度 优先 和 广度 优先 。 


深度 优先 遍历 
给 定 一 棵 由 根 、 左 子 树 、 右 子 树 构成 的 二 叉 树 ， 我 们 可 以 定义 6 种 不 同 的 深度 优先 遍历 


次 序 。 计 算 机 科学 家 已 经 在 文献 中 定义 了 其 中 三 种 的 标准 名 称 ， 另 外 三 种 没有 名 称 但 很 容易 


导出 。 图 12-24 中 给 出 了 标准 遍历 。 
。 前 序 人 遍历 。 在 前 序 遍 历 中 ， 根 首先 被 访问 ， 接 着 是 左 子 树 ， 最 后 是 右 子 树 。 前 缀 pre 


表示 根 在 子 树 前面 被 处 理 。 
。 中 序 人 遍历。 在 中 序 遍历 中 ， 先 处 理 左 子 树 ， 然 后 是 根 ， 最 后 是 右 子 树 。 前 级 in 表示 


根 在 子 树 之 间 被 处 理 。 
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。 后 序 遍 历 。 在 后 序 遍 历 中 ， 根 在 左 、 右 子 树 都 处 理 完 后 才 处 理 。 前 缀 post 表示 根 在 





子 树 之 后 被 处 理 。 
1 
A 和 A Kk 
左 子 树 右 子 树 左 子 树 右 子 树 左 子 树 右 子 树 
a) 前 序 遍 历 b) 中 序 遍历 c) 后 序 遍 历 


图 12-24 ”二叉树 的 深度 优先 遍历 


六 时 由 图 12-25 显示 了 我 们 使 用 前 序 遍 历 访问 树 中 的 每 个 节点 。 图 中 还 显示 了 行 
走 次 序 。 在 前 序 遍 历 中 ， 当 我 们 从 左边 经 过 一 个 节点 时 ,访问 该 节点 。 节 点 被 访问 的 顺序 
BB 直 了 





bj 行走 次 序 
图 12-25 例 12-10 
广度 优先 遍历 
在 二 叉 树 的 广度 优先 遍历 中 ， 先 处 理 节 点 的 子 节点 ， 然 后 进行 下 一 层 。 就 像 在 深度 优先 
遍历 中 一 样 ， 我 们 也 可 以 用 行走 来 跟踪 遍历 。 
12-26 显示 了 我 们 使 用 广度 优先 遍历 访问 树 中 的 每 个 节点 。 图 中 还 显示 
了 行走 的 次 序 。 遍 历 的 顺序 是 : A、B、E、C、D、F。 





图 12-26 例 12-11 


12.5.3 二叉树 的 应 用 
二 叉 树 在 计算 机 科学 中 有 许多 应 用 ， 本 节 只 介绍 其 中 的 两 种 : 赫 夫 曼 编 码 和 表达 式 树 。 
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1. 赫 夫 曼 编码 
赫 夫 曼 编码 是 一 种 压缩 技术 ， 它 使 用 二 叉 树 来 生成 一 个 符号 串 的 可 变 长 度 的 二 进 制 编 


码 。 我 们 将 在 第 15 章 中 详细 讨论 赫 夫 曼 编 码 。 


2. 表达 式 树 
一 个 算术 表达 式 可 以 用 三 种 格式 来 表示 : 中 缀 、 后 缀 、 前 缓 。 在 中 绥 表 示 中 ， 操 作 符 是 


处 于 两 个 操作 数 中 间 的 ; 在 后 级 表示 中 ， 操 作 符 是 处 于 两 个 操作 数 之 后 的 ; 在 前 级 表示 中 ， 
操作 符 是 处 于 两 个 操作 数 之 前 的 。 对 于 两 个 操作 数 A 和 B 的 加 法 运算 ， 这 些 格式 显示 如 下 : 

前 组 : + AB 中 级 : 到 + 日 后 级 ; AB+ 

虽然 我 们 在 编程 语言 中 使 用 中 缀 表示 ， 但 编译 程序 经 常 在 计算 表达 式 之 前 需要 把 它们 转 
变 为 后 缠 表 示 。 进 行 转换 的 一 种 方法 就 是 建立 表达 式 树 。 在 表达 式 树 中 ， 根 和 内 部 节点 是 操 
作 符 ， 而 叶子 是 操作 数 。 三 种 标准 的 遍历 (图 12-24 中 前 序 、 中 序 和 后 序 ) 表示 了 三 种 不 同 
的 表达 式 格式 : 中 缀 、 后 缀 、 前 绎 。 中 序 遍 历 产生 了 中 级 表达 式 ; 后 序 遍 历 产生 了 后 级 表达 
式 ; 前 序 遍 历 产生 了 前 缀 表达 式 。 图 12-27 显示 了 表达 式 和 表达 式 树 。 注 意 只 有 中 级 表示 法 


需要 括号 。 





12-27 表达 式 树 


12.5.4 二叉树 的 实现 
二 叉 树 可 以 使 用 数组 或 链表 来 实现 。 对 于 删除 和 插入 操作 ， 链 表 实现 的 效率 要 高 ， 所 以 
更 为 流行 。 


12.5.5 二 又 搜 索 树 


二 又 搜索 树 (BST) 是 一 种 具有 额外 特性 的 二 叉 树 : 每 个 
节点 的 关键 字 值 大 于 左 子 树 中 所 有 节点 的 关键 字 值 ， 而 小 于 右 
子 树 中 所 有 节点 的 关键 字 值 。 图 12-28 显示 了 这 样 的 思想 。 

图 12-29 显示 了 一 些 二 叉 搜 索 树 和 一 些 非 。” /全 和 3 (EN 
二 叉 搜索 树 。 注 意 ， 如 果 所 有 子 树 是 二 叉 搜 索 树 ， 并 且 整 棵 sii 
树 也 是 二 又 搜索 树 ， 那 这 棵 树 才 是 二 又 搜索 树 。 人 

BST 的 一 个 非常 有 趣 的 特性 是 : 如 果 我 们 对 二 叉 树 应 用 中 序 遍 历 ， 被 访问 的 元 素 以 升 
序 排 列 。 例 如 ， 在 图 12-29 中 ， 当 使 用 中 序 遍 历时 ， 得 到 列表 : (3，6，17)、( 17，19 ) 和 
《人 榜 茵 


二 又 搜索 树 (BSTj 的 中 序 遍 历 创建 了 一 个 天 序列 表 。 可 
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Pe oe 


图 12-29 例 12-12 


BST 的 另 一 个 有 趣 的 特性 是 : 我 们 能 对 二 叉 搜 索 树 使 用 在 第 8 章 中 使 用 的 折 半 查找 。 
图 12-30 显示 了 BST 搜索 的 UML 图 。 





[target = root.key] 
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图 12-30 ”二 叉 搜索 树 的 中 序 遍 历 


1, 二 叉 搜 索 树 的 抽象 数据 类 型 

二 叉 树 的 抽象 数据 类 型 与 我 们 为 具有 相同 操作 的 广义 线性 表 所 定义 的 抽象 数据 类 型 相 
似 。 事 实 上 ， 如 今 BST 表 比 广 义 线性 表 更 为 常见 ， 因 为 BST 的 查找 效率 比 广 义 线性 表 要 
高 ， 广 义 线性 表 中 只 能 使 用 顺序 查找 ， 而 BST 中 可 以 使 用 折 半 查找 。 

2 . 二 叉 搜 索 树 的 实现 

BST 可 以 使 用 数组 或 链表 来 实现 。 但 是 ， 链 表 结 构 更 为 常见 并 且 效 率 更 高 。 线 性 实现 
使 用 带 有 两 个 指针 的 节点 : 去 指针 和 右 指 针 。 左 指针 指向 左 子 树 ， 右 指针 指向 右 子 树 。 如 果 
左 子 树 为 空 ， 则 左 指针 也 为 空 ; 如 果 右 子 树 为 空 ， 则 右 指 针 也 为 空 。 像 广义 线性 表 的 链表 实 
现 一 样 ，BST 的 链表 实现 也 使 用 一 个 与 BST 具有 相同 名 字 的 虚构 节点 。 该 虚构 节点 的 数据 
部 分 含有 关于 树 的 信息 ， 如 树 中 的 节点 数目 。 指 针 部 分 指向 树 的 根 。 图 12-31 显示 了 一 棵 二 
叉 搜 索 树 ， 其 中 每 个 节点 的 数据 域 是 一 个 记录 。 


count Toot 





图 12-31 二 叉 搜索 树 的 实现 
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12.6 图 

图 是 由 一 组 节点 ( 称 为 顶点 ) 和 一 组 顶点 间 的 连 线 ( 称 为 边 或 弧 ) 构成 的 一 种 抽象 数据 
类 型 。 树 是 定义 成 层次 结构 的 ， 节 点 只 能 有 一 个 双亲 ， 而 图 中 的 节点 可 以 有 一 个 或 多 个 双 
亲 。 图 可 能 是 有 向 的 或 无 向 的 。 在 有 向 图 
中 ， 连 接 两 个 顶点 的 边 都 有 从 一 个 顶点 到 
另 一 个 顶点 的 方向 (在 图 中 用 箭头 表示 )。 
在 无 向 图 中 ， 边 是 没有 方向 的 。 图 12-32 
显示 了 一 个 有 向 图 (a) 和 一 个 无 向 图 (b) EE 
的 例子 。 

图 中 的 顶点 可 以 代表 对 象 或 概念 ， 边 引 有 向 图 无 站 村 
或 弧 可 以 代表 这 些 对 象 或 概念 间 的 关系 。 
如 果 图 是 有 向 的 ， 那 么 关系 就 是 单 向 的 ; 如 果 图 是 无 向 的 ， 那 么 关系 就 是 双向 的 。 
城市 的 地 图 和 连接 城市 的 道路 可 以 表示 成 计算 机 中 的 一 个 无 向 图 。 城 市 是 
顶点 ,无 向 边 是 连接 它们 的 道路 。 如 果 我 们 要 显示 出 城市 间 的 距离 ， 可 以 使 用 加 权 图 ， 其 中 
的 每 条 边 都 有 一 个 权重 ， 该 权重 表示 由 这 条 边 连接 的 两 个 城市 间 的 距离 。 

EPE 图 的 另 一 个 应 用 是 在 计算 机 网 络 (第 6 章 ) 中 的 应 用 。 顶 点 可 以 代表 节点 或 
集线器 ， 边 可 以 代表 路 由 。 每 条 边 都 有 一 个 权重 ， 表 示 从 一 个 集线器 到 相 邻 集线器 的 代价 。 
路 由 器 能 使 用 图 算法 找到 它 与 包 的 最 终 目的 地 间 的 最 短路 径 。 


12.7 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 
e。 Gilberg, R. and Forouzan, B. Data Structures-4d Pseudocode Approach with C, Boston, 


MA: Course Technology, 2005 
e Goodrich, M. and Tamassia, R. Data Structures and Algorithms in Java, New York: 


Wiley, 2005 
es。 Nyhoff, L. ADTs, Data Structures, and Problem Solving with C++, Upper Saddle River, 


NJ: Prentice-Hall, 2005 


图 12-32 图 








关键 术语 

abstract data type (ADT， 抽 象 数据 类 型 ) dequeue (出 队 ) 

ancestor (祖先 ) descendent (子孙 ) 

arc( 弧 ) diagraph (有 问 图 ) 

binary search tree (BST， 二 又 搜索 树 ) directed graph (有 加 图 ) 

binary tree (二 叉 树 ) edge ( 边 ) 

breadth-first traversal (广度 优先 遍历 ) enqueue (人 队 ) 

child (孩子 ) expression tree (表达 式 树 ) 

delete operation (删除 操作 ) first in, first out (FIFO ， 先 进 先 出 ) 


depth-first traversal (深度 优先 过 历 ) front〈( 头 部 ) 
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general linear list (广义 线性 表 ) postorder traversal (后 序 遍 历 ) 
graph (图 ) prefix (前 级) 

Huffman coding ( 赫 夫 受 编码 ) preorder traversal (前 序 遍 历 ) 
infix (中 级 ) z push (人 栈 ) 

inorder traversal (中 序 遍 历 ) queue (队列 ) 

interface (接口 ) rear (尾部 ) 

internal node (内 部 节点 ) root ( 根 ) 

last in, first out (LIFO， 后 进 先 出 ) sibling (兄弟 ) 

leaf (叶子 ) stack ( 栈 ) 

linear list (线性 表 ) subtree ( 子 树 ) 

node (节点 ) traversal (遍历 ) 

parent (双亲 ) tree ( 树 ) 

path (路 径 ) undirected graph (无 向 图 ) 
pop〈 出 栈 ) vertex (顶点 ) 

postfix (后 缀 ) 、 

小 结 


虽然 多 种 简单 数据 类 型 在 所 有 的 编程 语言 中 已 经 被 实现 ， 但 是 大 多 数 语言 并 没有 定义 复 
杂 的 数据 类 型 。 抽 象 数据 类 型 (ADT) 是 一 个 定义 新 数据 类 型 、 定 义 该 数据 类 型 的 操作 以 及 


封装 数据 和 操作 的 包 。 
。 栈 是 一 种 限制 线性 表 ， 该 列表 中 的 添加 和 删除 被 限制 在 称 为 栈 项 的 一 端 进行 。 如 果 我 


们 把 一 系列 数据 项 插 人 栈 中 ， 然 后 又 移 除 它们 ， 那 么 数据 的 次 序 就 被 颠倒 了 。 这 个 
倒 排 的 属性 就 是 栈 被 称 为 后 进 先 出 (LIFO) 的 原因 。 我 们 定义 栈 的 4 种 基本 操作 :， 建 
栈 、 入 栈 、 出 栈 和 空 。 

队列 是 一 种 线性 表 ， 且 数据 的 插入 只 能 在 称 为 尾部 的 一 端 进 行 ， 而 数据 的 删除 只 能 
在 称 为 头 部 的 另 一 端 进行 。 这 种 限制 保证 了 通过 队列 数据 被 处 理 的 次 序 就 是 数据 被 接 
收 的 次 序 。 换 言 之 ， 队 列 是 一 种 先进 先 出 (FIFO) 结构 。 我 们 为 队列 定义 了 4 种 基本 
操作 : 建 队 列 、 入 队 、 出 队 和 空 。 广 义 线性 表 是 一 种 像 插 入 和 删除 等 操作 可 以 在 表 中 
任意 位 置 进行 的 表 ， 可 以 在 头 部 、 中 间或 尾部 。 我 们 为 广义 线性 表 定 义 了 6 种 操作 : 
建 表 、 插 和 入、 删除、 检索 、 遍 历 和 空 。 

树 包括 一 组 有 限 的 元 素 ， 称 为 节点 (或 顶点 )。 同 时 包括 一 组 有 限 的 有 向 线段 ， 用 来 
连接 节点 ， 称 为 弧 。 如 果树 非 空 ， 则 有 一 个 没有 进入 弧 的 节点 称 为 根 。 二 叉 树 是 其 中 
没有 节点 而 有 多 于 两 棵 子 树 的 树 。 换 言 之 ， 节 点 只 能 有 0 棵 、! 棵 或 2 棵 子 树 。 二 又 
树 的 过 历 要 求 以 预定 的 顺序 访问 树 的 每 一 个 节点 且 仅 访 问 一 次 。 遍 历 序列 的 两 种 主要 
方法 是 深度 优先 和 广度 优先 。 二 叉 搜 索 树 (BST) 是 一 种 具有 额外 特性 的 二 叉 树 ; 每 
个 节点 的 关键 字 值 大 于 左 子 树 中 所 有 节点 的 关键 字 值 ， 而 小 于 右 子 树 中 所 有 节点 的 关 
键 字 值 。 

图 是 由 一 组 节点 ( 称 为 顶点 ) 和 一 组 顶点 间 的 连 线 ( 称 为 边 或 弧 ) 构成 的 一 种 抽象 数 
据 类 型 。 树 是 定义 成 层次 结构 的 ， 节 点 只 能 有 一 个 双亲 ， 而 图 中 的 节点 可 以 有 一 个 或 
Et 
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12.8 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 

Q12-1 什么 是 抽象 数据 类 型 ? 在 抽象 数据 类 型 中 ， 什 么 是 已 知 的 ? 什么 是 隐藏 的 ? 
Q12-2 什么 是 栈 ? 本 章 定义 的 栈 的 4 种 基本 操作 是 什么 ? 

Q12-3 什么 是 队列 ? 本 章 定 义 的 队列 的 4 种 基本 操作 是 什么 ? 本 
Q12-4 什么 是 广义 线性 表 ? 本 章 定义 的 广义 线性 表 的 6 种 基本 操作 是 什么 ? 
Q12-5 ”定义 一 棵 树 ， 区 分 树 和 二 叉 树 ， 区 分 二 叉 树 和 二 又 搜索 树 。 

Q12-6 二叉树 的 深度 优先 遍历 和 广度 优先 遍历 有 何不 同 ? 

Q12-7 什么 是 图 ? 有 向 图 和 无 向 图 的 区 别 是 什么 ? 

Q12-8 列 出 栈 和 队列 的 一 些 应 用 。 

Q12-9 列 出 广义 线性 表 的 一 些 应 用 。 

Q12-10 列 出 二 叉 树 和 二 叉 搜 索 树 的 一 些 应 用 。 


练习 题 


P12-1 写 出 一 个 算法 的 片段 ， 使 用 while 循环 清空 栈 S2 中 的 内 容 。 
P12-2 写 出 一 个 算法 的 片段 ， 用 一 个 while 循环 把 栈 S1 的 内 容 移 到 栈 S2。 操 作 后 栈 S1 的 内 容 为 空 。 
P12-3 ” 写 出 一 个 算法 的 片段 ， 用 一 个 while 循环 把 栈 S1 的 内 容 复制 给 栈 S2。 操 作 后 栈 S1 和 栈 S2 的 


内 容 应 该 相同 。 
P12-4 写 出 一 个 算法 的 片段 ， 用 一 个 while 循环 连接 栈 S1 的 与 栈 S2， 并 且 连 接 后 栈 S2 中 的 元 素 位 


于 栈 S1 的 顶端 。 栈 S2 应 为 空 。 
P12-5 给 出 执行 下 列 算法 片段 后 栈 S1 的 内 容 以 及 变量 x 和 y 的 值 。 


stack (S1) 
push(S1, 5) 
push (Sl1, 3) 
push (Sl1, 2) 
if (not emptyt{S]) 
{ | 
pop(S1, x) 
) 
if(not empty(S1)) 
{ 
pop (Ss1, y) 
) 
push (S11, 6) 


P12-6” 回 文 是 一 种 顺 读 与 倒 读 结果 一 致 的 字符 串 。 例 如 ， 如 果 忽 略 其 中 的 空格 ， 以 下 就 是 回 文 : 
Able was I ere I saw Elba 


写 出 一 种 算法 ， 用 栈 来 测试 字符 串 是 否 是 回 文 。 
P12-7 用 伪 代 码 写 出 一 种 用 来 比较 两 个 栈 中 内 容 的 算法 。 
P12-8 用 一 个 while 循环 来 清空 队列 Q 的 内 容 。 
P12-9 用 一 个 while 循环 把 队列 Q1 的 内 容 移动 到 队列 Q2。 操 作 后 队列 Q1 应 该 为 空 。 
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P12-10 
P12-11 


P12-12 
P12-13 


P12-14 


P12-15 


P12-16 


P12-17 
P12-18 
P12-19 
P12-20 
P12-21 


P12-22 


用 一 个 while 循环 把 队列 Q1 的 内 容 复 制 到 队列 Q2。 操 作 后 队列 Q1 和 队列 Q2 的 内 容 应 该 
相同 。 、 

用 一 个 while 循环 把 队列 Q2 的 内 容 连接 到 队列 Q1 的 内 容 的 后 面 。 连 接 后 ， 队 列 Q2 的 内 容 
应 该 位 于 队列 Q1 的 尾部 。 队 列 Q2 应 该 为 空 。 

写 出 用 来 比较 两 个 队列 的 算法 。 

找 出 下 列 二 叉 树 的 根 ， 

a, 后 序 遍 历 树 : FCBDG b. 前 序 遍历 树 : IBCDFEN c. 后 序 遍 历 树 : CBIDFGE 
一 棵 二 叉 树 有 10 个 节点 。 树 的 中 序 遍 历 和 前 序 遍历 如 下 。 画 出 这 棵 树 。 

前 序 ，JCBADEFIGH 

中 序 ， ABCEDFJGIH 

一 棵 二 叉 权 有 8 个 节点 。 中 序 遍 历 和 后 序 遍 历 如 下 。 夯 出 这 棵 树 。 

后 序 ， FECHGDBA 

中 序 : FECABHDG 

一 棵 二 叉 树 有 7 个 节点 。 中 序 遍 历 和 后 序 遍 历 如 下 。 你 能 画 出 这 棵 树 吗 ? 如果 不能 ， 说 明 
理由 。 

后 序 ; GFDABEC 

中 序 . ABDCEFG 

用 伪 代 码 创 建 抽象 数据 类 型 包 ， 使 用 数组 作为 数据 结构 ， 实 现 本 章 为 栈 定义 的 4 种 操作 。 

用 伪 代 码 创 建 抽象 数据 类 型 包 ， 使 用 链表 作为 数据 结构 ， 实 现 本 章 为 栈 定义 的 4 种 操作 。 

用 伪 代 码 创建 抽象 数据 类 型 包 ， 使 用 数组 作为 数据 结构 ， 实 现 本 章 为 队列 定义 的 4 种 操作 。 
用 伪 代 码 创建 抽象 数据 类 型 包 ， 使 用 链表 作为 数据 结构 ， 实 现 本 章 为 队列 定义 的 4 种 操作 。 
用 伪 代 码 创建 抽象 数据 类 型 包 ， 使 用 数组 作为 数据 结构 ， 实 现 本 章 为 广义 线性 表 定 义 的 6 种 . 
操作 。 

用 伪 代 码 创建 抽象 数据 类 型 包 ， 使 用 链表 作为 数据 结构 ， 实 现 本 章 为 广义 线性 表 定 义 的 6 种 
操作 。 
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在 这 一 章 中 ,我们 将 讨论 文件 的 结构 。 基 于 不 同 的 应 用 ， 使 用 多 种 方法 ,文件 被 存储 在 
辅助 存储 设备 中 。 我 们 还 将 讨论 单个 记录 是 如 何 被 检索 的 。 本 章 是 下 一 章 的 前 序 ， 下 一 章 将 
讨论 相关 文件 的 集合 〈 称 为 数据 库 ) 是 如 何 组 织 和 存 取 的 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 定义 两 类 存 取 方法 : 顺序 存 取 和 随机 存 取 ; 

。 理解 顺序 文件 的 结构 和 它们 是 如 何 更 新 的 ; 

。 理解 索引 文件 的 结构 和 索引 文件 与 数据 文件 间 的 关系 ; 

。 理解 散 列 文件 背后 的 概念 ， 说 出 一 些 散 列 方法 ; 

。 描述 地 址 冲突 和 它们 是 如 何 解 决 的 ; 

。 定义 目录 和 它们 是 如 何 用 来 组 织 文 件 的 ; 

。 区 分 文本 文件 和 二 进 制 文件 。 


13.1 引言 

文件 存储 在 辅助 存储 设备 或 二 级 存储 设备 中 。 两 种 最 常见 的 二 级 存储 设备 是 磁盘 和 磁 
带 。 文 件 在 二 级 存储 设备 中 是 可 读 写 的 。 文 件 也 可 以 以 计算 机 只 能 写 不 能 读 的 形式 存在 。 例 
如 ， 在 系统 监视 器 上 显示 的 信息 ， 就 是 一 种 类 似 于 发 送 到 打印 机 的 数据 形式 的 文件 。 广 义 


上 ， 键 盘 也 是 文件 ， 虽 然 它 并 不 能 存储 数据 。 
按照 我 们 的 意图 ， 文 件 是 数据 记录 的 集合 ， 每 一 个 记录 都 由 一 个 或 多 个 域 组 成 。 就 像 第 


11 章 中 定义 的 一 样 。 
在 设计 一 个 文件 时 ， 关 键 问 题 是 如 何 从 文件 中 检索 信息 (一 个 特定 的 记录 )。 有 时 需要 
一 个 接 一 个 地 处 理 记 录 ， 有 时 又 需要 快速 存 取 一 个 特定 的 记录 而 不 用 检索 前 面 的 记录 。 存 取 


方法 决定 了 怎样 检索 记录 : 顺序 的 或 者 随机 的 。 


13.1.1 顺序 存 取 
如 果 需 要 顺序 地 存 取 记录 (一 个 接 一 个 ， 从 头 到 尾 )， 则 使 用 顺序 文件 结构 。 


13.1.2 随机 存 取 


如 果 想 存 取 某 一 特定 记录 而 不 用 检索 其 
之 前 的 所 有 记录 ， 则 使 用 允许 随机 存 取 的 文 
件 结构 。 有 两 种 文件 结构 都 允许 随机 存 取 : 





。 口 顺序 文件 索引 文件 
索引 文件 和 散 列 文件 。 文 件 结构 的 分 类 方法 其 天文 伯 


参见 图 13-1 。 图 13-1 文件 结构 的 分 类 
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13.2 顺序 文件 

顺序 文件 是 指 记 录 只 能 按照 顺序 从 头 到 尾 一 个 接 一 个 地 进行 存 取 。 图 13-2 给 出 了 一 个 
顺序 文件 的 设计 。 记 录 被 一 个 接 一 个 地 存储 到 
辅助 存储 器 (磁带 或 磁盘 ) 中 ， 并 在 最 后 的 记 
录 加 上 EOF (文件 末尾 ) 的 标志 。 操 作 系 统 没 
有 有 关 记 录 地 址 的 信息 ， 它 只 知道 记录 是 一 个 


挨 着 一 个 存 取 的 。 
算法 13.1 显示 了 顺序 文件 中 的 记录 是 如 何 处 理 的 ， 我 们 一 个 接 一 个 地 处 理 记录 ， 当 操 


作 系统 处 理 完 最 后 一 个 记录 时 ， 检 测 到 EOF 标签 并 退出 循环 。 
算法 13.1 顺序 文件 中 记录 处 理 的 伪 代 码 


算法 : SequentialFileProcessing (file) 
作用 ; 处 理 顺 序 文件 中 的 所 有 记录 

前 提 : 给 定 在 辅助 存储 器 上 的 文件 的 开始 地 址 
后 续 ; 无 

返回 ; 无 





图 13-2 顺序 文件 


while (Not EOF) 
{ 


Read the next record from the auxiliary storage into memory 
Process the record 
) 
} 


顺序 文件 用 于 需要 从 头 到 尾 存 取 记 录 的 应 用 。 例 如 ， 如 果 公司 里 每 个 职员 个 人 资料 存储 
于 一 个 文件 中 ， 月 底 就 可 以 通过 顺序 存 取 检 索 每 条 记录 来 打印 工资 。 在 这 里 ， 因 为 必须 处 理 
每 一 个 记录 ， 所 以 顺序 存 取 比 随机 存 取 更 简便 有 效 。 

然而 ， 顺 序 文件 对 随机 存 取 来 说 效率 并 不 高 。 例 如 ， 如 果 一 个 银行 的 所 有 客户 记录 只 能 
被 顺序 存 取 ， 那 么 一 个 客户 想 从 自动 取款 机 中 提 款 ， 就 要 等 到 系统 从 头 开始 查找 直到 找到 这 
名 客户 的 信息 。 如 果 这 个 银行 有 100 万 个 客户 ， 系 统 在 查 到 记录 之 前 平均 要 检索 50 万 个 记 


录 。 效 率 是 非常 低 的 。 


13.2.1 更 新 顺序 文件 
顺序 文件 必须 定期 更 新 ， 以 反映 信息 的 变化 。 更 新 过 程 将 非常 棘手 ， 因 为 所 有 记录 都 要 


被 顺序 地 检查 和 更 新 (必要 的 话 )。 


1. 需要 更 新 的 文件 
和 更 新 程序 有 关 的 一 共有 4 个 文件 : 新 主 文件 、 旧 主 文件 、 事 务 文 件 和 错误 报告 文件 。 


所 有 这 些 文件 根据 关键 字 值 被 分 类 。 图 13-3 是 顺序 文件 更 新 的 图 示 。 在 这 个 图 中 ,包含 刚 
刚 讨论 过 的 4 个 文件 。 虽 然 我 们 用 了 磁带 的 符号 表示 文件 ， 但 是 我 们 可 以 很 容易 用 磁盘 的 符 
号 表示 。 注 意 在 更 新 完成 之 后 ， 新 主 文件 要 被 送 到 脱 机 存储 器 中 去 ,直到 再 次 需要 为 止 。 当 
文件 被 更 新 时 ， 主 文件 将 从 脱 机 存储 器 中 检索 返回 ， 成 为 旧 主 文件 。 
。 新 主 文件 。 新 的 永久 数据 文件 通常 称 为 新 主 文件 。 新 的 主 文件 里 包含 大 部 分 当前 数据 。 
。 旧 主 文件 。 它 是 需要 更 新 的 永久 文件 。 即 使 在 更 新 后 ， 旧 主 文件 作为 参考 将 继续 保留 。 
。 事务 文件 。 第 三 种 文件 是 事务 文件 。 它 包含 将 要 对 主 文件 作 的 改变 。 在 所 有 的 文件 更 
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新 中 ， 一 共有 三 种 基本 类 型 的 改变 。 添 加 事务 包含 将 要 追加 到 主 文件 中 的 新 数据 。 删 
除 事务 把 将 要 从 文件 中 删除 的 记录 标识 出 来 。 而 更 改 事务 则 包含 对 文件 中 特定 记录 的 
修改 。 要 处 理 这 些 事务 就 需要 键 。 键 就 是 文件 中 一 个 或 多 个 能 唯一 标识 数据 的 字段 。 
例如 ， 在 一 个 关于 学 生 的 文件 里 ， 键 是 学 生 的 学 号 。 在 一 个 关于 雇员 的 文件 里 ， 键 是 
社会 保险 号 。 

。 错误 报告 文件 。 在 更 新 程序 中 需要 的 第 4 个 文件 是 错误 报告 文件 。 更 新 过 程 中 难免 不 
出 任何 错误 。 当 错误 发 生 时 ， 应 向 用 户 报告 错误 。 错 误 报 告 包括 在 数据 更 新 时 所 发 
现 的 错误 的 清单 ， 并 且 提 供给 用 户 以 进行 纠 错 操作 。 下 一 节 描 述 能 导致 错误 的 一 些 





情况 。 
事务 文件 
图 13-3 ”更 新 顺序 文件 
2. 文件 更 新 过 程 


要 使 文件 更 新 过 程 有 效率 ， 所 有 文件 都 必须 按 同 一 个 A: 增加 
键 排序 。 更 新 过 程 如 图 13-4 所 示 。 : 

更 新 过 程 要 求 比 较 事务 文件 和 主 文件 中 的 键 ， 假 定 在 
没有 错误 发 生 的 情况 下 ， 更 新 过 程 遵循 以 下 步骤 : 

1 ) 如 果 事 务 文件 的 键 小 于 主 文件 的 键 ， 事 务 就 是 一 个 
增加 (A)， 则 将 事务 追加 到 新 主 文件 中 。 

2 ) 如 果 事 务 文件 的 键 与 主 文件 的 相同 ， 则 

a. 如 果 事 务 是 修改 (C)， 则 修改 主 文件 数据 。 

b. 如 果 事 务 是 删除 (D)， 则 将 数据 从 主 文件 中 删除 。 

3 ) 如 果 事 务 文件 的 键 大 于 主 文件 的 键 ， 将 旧 主 文件 记 
录 写 人 新 主 文件 。 

4 ) 有 几 种 情况 可 能 产生 一 个 错误 ， 错 误 被 记录 在 错误 
报告 文件 中 : 

a. 如 果 事务 定义 追加 一 个 旧 主 文件 中 已 经 存在 的 记录 (相同 键 值 )。 

b. 如 果 事 务 定 义 删除 或 修改 一 个 旧 主 文件 中 不 存在 的 记录 。 


13.3 索引 文件 


在 文件 中 随机 存 取 记录 ， 需 要 知道 记录 的 地 址 。 例 如 ， 一 个 客户 想 要 查询 银行 账户 。 客 
户 和 出 纳 员 都 不 知道 客户 记录 的 地 址 。 客 户 只 能 给 出 纳 员 自己 的 账号 ( 键 )。 这 里 ， 索 引文 





图 13-4 更 新 过 程 


对 俯 形 和 袍 





件 可 以 把 账号 和 记录 地 址 关联 起 来 (图 13-5 )。 





图 13-5 索引 文件 中 的 映射 


索引 文件 由 数据 文件 组 成 ， 它 是 带 索引 的 顺序 文件 。 索 引 本 身 非 常 小 ， 只 占 两 个 字段 ; 
顺序 文件 的 键 和 在 磁盘 上 相应 记录 的 地 址 。 索 引 基于 数据 文件 的 关键 字 值 排序 图 13-6 给 出 
了 索引 文件 的 逻辑 视图 。 

存 取 文件 中 的 记录 需 按 以 下 步骤 : 

1 ) 整个 索引 文件 都 载 人 内 存 中 (文件 很 小 ， 只 占用 很 小 的 内 存 空间 )。 

2 ) 搜索 项 目 ， 用 高 效 的 算法 (如 折 半 查找 法 ) 查找 目标 键 。 

3 ) 检索 记录 的 地 址 。 

4 ) 按照 地 址 ， 检 索 数 据 记 录 并 返回 给 用 户 。 
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图 13-6 索引 文件 的 逻辑 视图 


13.3.1 倒 排 文件 


索引 文件 的 好 处 之 一 就 是 可 以 有 多 个 索引 ， 每 个 索引 有 不 同 的 键 。 例 如 ， 职 员 的 文件 可 
以 按 社 会 保险 号 或 姓名 来 检索 。 这 种 索引 文件 被 称 为 倒 排 文件 。 


13.4 ” 散 列 文件 
在 索引 文件 中 ， 索 引 将 键 映 射 到 地 址 。 散 列 文件 用 一 个 数学 函数 来 完成 映射 。 用 户 给 出 


键 ， 函 数 将 键 映 射 成 地 址 ， 再 传送 给 操作 系统 ， 这 样 就 可 检索 记录 了 (图 13-7 )。 
散 列 文件 无 须 额外 的 文件 (索引 )。 在 索引 文件 中 ， 必 须 将 文件 的 索引 保存 在 磁盘 上 ， 
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当 需 要 处 理 数据 文件 时 ， 先 要 把 索引 导入 内 存 中 ， 搜 索索 引 找到 数据 记录 的 地 址 ， 表 访问 数 
据 文 件 存 取 记 录 。 在 散 列 文件 中 ， 用 函数 来 寻找 地 址 。 这 里 不 需要 索引 和 随 之 而 来 的 所 有 开 


销 。 然 而 ， 散 列 文件 自身 也 存在 问题 。 





图 13-7 和 散 列 文件 中 的 映射 


13.4.1 散 列 方法 

在 键 - 地 址 映射 中 ， 可 以 选择 多 种 散 列 方法 中 的 一 种 。 我 们 将 讨论 其 中 的 几 种 。 

1. 直接 散 列 法 

在 直接 散 列 法 中 ， 键 是 未 经 算法 处 理 的 数据 文件 地 址 。 文 件 因此 必须 对 每 个 可 能 的 键 都 
包含 一 个 记录 。 虽 然 用 直接 散 列 的 情况 很 少 ， 但 它 非常 有 用 ， 因 为 它 保证 没有 其 他 方法 所 存 
在 的 同义词 或 冲突 问题 (本 章 后 面 介绍 )。 

让 我 们 看 一 个 小 例子 。 假 如 有 一 个 机 构 ， 雇 员 少 于 100 名 。 每 个 雇员 都 被 分 配 一 个 1 到 
100 之 间 的 编号 (雇员 ID )。 在 这 种 情形 下 ， 如 果 建 立 了 一 个 有 100 个 记录 的 文件 ， 雇 员 的 
编号 可 以 作为 任何 单独 记录 的 地 址 。 这 个 概念 如 图 13-8 所 示 。 键 为 025( John Carver) 的 记 
录 被 散 列 为 地 址 ( 扇 区 ) 025。 注 意 不 是 文件 中 任何 元 素 都 包含 一 个 雇员 信息 ， 有 些 空间 被 
浪费 了 。 







从 姓名 余额 
001| 001 [Mary Dodd | 1432.45 


存 取 直 接 散 列 文件 





图 13-8 ”直接 散 列 


虽然 这 是 一 种 理想 的 方法 ， 但 它 的 应 用 非常 有 限 。 例 如 ， 用 社会 保险 号 作为 键 效 率 是 非 
常 低下 的 ， 因 为 社会 保险 号 有 9 位 。 这 样 需要 一 个 有 999 999 999 条 记录 的 巨大 文件 ， 但 是 
可 能 只 用 到 不 到 100 条 记录 。 因 此 ， 让 我 们 把 注意 力 转 到 可 以 把 大 量 可 能 的 键 映 射 为 一 个 小 


的 地 址 空间 的 散 列 技术 。 
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2. 求 模 法 

求 模 法 也 称 为 除 余 散 列 法 ， 求 模 方 法 用 文件 大 小 去 除 键 后， 将 余数 加 1 作为 地 址 。 下 面 
给 出 了 一 个 简单 散 列 算法 ， 这 里 list_size 是 文件 中 元 素 的 数目 。 求 模 运 算 的 结果 加 1 是 因为 
我 们 的 表 始 于 1 而 不 是 0。 

address = key mod list size + 1 

虽然 这 个 算法 适用 于 任何 列表 大 小 ， 但 是 一 个 为 素数 的 列表 大 小 要 比 其 他 的 列表 大 小 产 
生 更 少 的 冲突 。 因 此 只 要 可 能 ， 尽 量 用 素数 作为 文件 的 大 小 。 

如 果 小 公司 扩大 了 ， 很 快 就 会 发 现 雇员 不 久 将 超过 100 名 。 长 远 起 见 ， 创 建 一 个 新 的 
可 以 处 理 100 万 雇员 的 雇员 编号 系统 。 同 时 决定 提供 可 以 容纳 300 名 雇员 的 数据 空间 。 第 一 
个 大 于 300 的 素数 是 307。 因 此 选择 307 作为 列表 (文件 ) 的 大 小 。 新 的 雇员 列表 和 一 些 散 
列 地 址 如 图 13-9 所 示 。 在 这 种 情况 下 ，Bryan Devaux， 其 键 为 121267， 被 散 列 到 地 址 003， 
因为 121267 mod 307 = 2， 然 后 再 加 1， 就 可 以 得 到 地 址 003。 


001|379452|Mary Dodd | 1432.45| 





图 13-9 求 模 


3. 数字 析 取 散 列 法 
如 果 用 数字 析 取 散 列 法 ， 则 选择 从 键 中 析 取 的 数字 作为 地 址 。 例 如 ， 从 6 位 的 员工 编号 


中 析 取 3 位 地 址 (000 一 999 )， 可 以 选择 (从 左 数 ) 第 一 、 第 三 和 第 四 位 数 作为 地 址 。 用 
图 13-9 中 的 键 把 它们 散 列 为 如 下 地 址 : 


125870 ~» 158 122801 一 128 121267 一 12 


4. 其 他 方法 
还 有 其 他 流行 的 方法 ， 像 平方 中 值 法 、 折 区 法 、 旋 转 法 和 伪 随 机 法 。 我 们 把 这 几 种 方法 


作为 练习 。 


13.4.2 冲突 

通常 散 列 列表 中 键 的 数量 比 在 数据 文件 中 的 记录 数量 要 多 。 例 如 ， 如 果 你 有 一 个 包含 
50 名 学 生 的 班级 的 文件 ， 学 生 由 最 后 4 位 社会 保险 号 标识 ， 这 样 在 文件 中 每 个 元 素 就 有 200 
个 可 能 的 键 (10000/50 )。 因 为 在 文件 中 有 很 多 键 对 应 于 一 个 地 址 。 有 可 能 多 于 一 个 的 键 将 
馈 散 列 为 文件 中 的 同一 个 地 址 。 我 们 把 列表 中 一 些 上 映射 为 同一 地 址 的 键 称 为 同义词 。 冲 突 概 


念 参见 图 13-10。 
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在 图 13-10 中 ， 当 为 两 个 不 同 的 记录 计算 地 址 时 ， 得 到 相同 的 地 址 (214 )。 显 然 ， 两 个 
记录 不 能 储存 在 同一 个 地 址 之 中 。 需 要 按照 下 一 节 所 讨论 的 来 解决 这 种 情况 。 


123013 om 
键 地 址 冲突 
151564 a (相同 地 址 ) 
省 
散 列 函数 Sn 
图 13-10 ”冲突 


如 果 插 入 列表 的 实际 数据 中 有 两 个 或 多 个 同义词 ， 将 产生 冲突 。 冲 突 的 产生 是 在 散 列 算 
法 为 插入 键 产生 地 址 时 ， 发 现 该 地 址 已 被 占用 。 由 散 列 算法 产生 的 地 址 称 为 内 部 地 址 。 包 含 
所 有 内 部 地 址 的 区 域 称 为 主 区 。 当 两 个 键 在 内 部 地 址 上 冲突 时 ， 必 须 将 其 中 一 个 键 和 数据 存 
放 到 主 区 外 的 另 一 个 地 址 单元 中 来 解决 冲突 。 


冲突 解决 法 
除了 直接 法 ， 所 讨论 过 的 散 列 方法 没有 一 种 能 建立 一 一 对 应 的 关系 。 这 就 意味 着 当 新 建 


的 键 散 列 为 地 址 时 ， 将 可 能 产生 冲突 。 有 有 几 种 方法 来 处 理 冲突 ， 每 种 都 不 依赖 于 散 列 算法 。 
任何 散 列 方法 都 可 以 用 于 冲突 解决 法 。 下 面 讨论 其 中 的 一 些 方法 。 

开放 寻 址 

第 一 种 冲突 解决 法 一 一 开放 寻 址 解决 法 ， 解 决 了 在 主 区 的 神 突 。 当 一 个 冲突 发 生 时 ， 主 
区 地 址 将 查找 开放 的 或 空闲 的 记录 来 用 于 存放 新 数据 。 对 于 不 能 在 内 部 地 址 中 存放 的 数据 ， 
一 种 简单 的 策略 就 是 把 该 数据 存储 在 内 部 地 址 的 下 一 个 地 址 中 去 (内 部 地 址 +1 )。 图 13-11 
展示 了 如 何 用 开放 寻 址 解决 法 解决 图 13-10 中 的 冲突 。 第 一 个 记录 存在 地 址 214 中 ， 下 一 个 
记录 存在 地 址 215 中 。 





图 13-11 开放 寻 址 解决 法 


链表 解决 法 

开放 寻 址 的 一 个 主要 缺点 是 每 个 冲突 的 解决 增加 了 将 来 冲突 的 可 能 性 。 这 个 整 端 在 另 
一 种 方法 中 得 到 了 解决 一 一 链表 解决 法 。 在 这 种 方法 中 ， 第 一 条 记录 存储 在 内 部 地 址 ， 但 
它 包 含 了 一 个 指向 下 一 条 记录 的 指针 。 图 13-12 展示 了 用 此 方法 如 何 解 决 图 13-10 中 冲突 的 


情况 。 





散 列 函数 


图 13-12 链表 解决 法 


桶 散 列 法 
另 一 种 处 理 冲 突 的 方法 是 散 列 到 桶 。 图 13-13 展示 了 如 何 用 桶 散 列 法 解决 图 13-10 中 的 


又 件 结 鸭 


冲突 ， 桶 是 一 能 接纳 多 个 记录 的 节点 。 这 种 方法 的 缺点 是 可 能 有 很 多 浪费 的 (未 占用 的 ) 存 
储 单 元 。 


123013 







刍 -起 赴 Ne mod 307: 十 =1 
151564 i 
散 列 函数 
图 13-13” 桶 散 列 解决 方案 
组 合 方 法 


有 很 多 方法 可 以 用 来 解决 冲突 。 正 如 散 列 方法 一 样 ， 复 杂 的 实现 方法 通常 是 组 合 使 用 多 
种 方法 。 


13.5 目录 

目录 是 大 多 数 操作 系统 提供 的 ， 用 来 组 织 文件 。 目 录 完 成 的 功能 就 像 是 档案 柜 中 的 文 
件 夹 一 样 。 但 是 ， 在 大 多 数 操作 系统 中 ， 目 录 被 表示 为 含有 其 他 文件 信息 的 一 种 特殊 文件 类 
型 。 目 录 的 作用 不 仅仅 像 一 种 索引 文件 ， 该 索引 文件 告诉 操作 系统 文件 在 辅助 存储 设备 上 的 
位 置 ， 目 录 还 包含 了 关于 它 所 包含 的 文件 的 其 他 信息 ， 如 : 谁 有 访问 文件 的 权限 ， 文 件 被 创 


建 、 存 取 和 修改 的 日 期 。 
在 大 多 操作 系统 中 ， 目 录 被 组 织 成 像 树 的 抽象 数据 类 型 (ADT)， 这 种 抽象 数据 类 型 在 


第 12 章 中 讨论 过 ， 其 中 除根 目录 外 每 个 目录 都 有 双亲 。 包 含 在 另 一 个 目录 中 的 目录 称 为 包 
含 目 录 的 子 目 录 。 
13.5.1 UNIX 操作 系统 中 的 目录 

在 UNIX 中， 目录 系统 的 组 织 如 图 13-14 所 示 。 


图 例 
em 
x Wn 全 












图 13-14 UNIX 目录 系统 的 一 个 例子 
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在 目录 结构 的 顶部 是 一 个 称 为 根 的 目录 。 虽 然 它 的 名 字 是 根 ， 但 在 与 目录 有 关 的 命令 
中 ， 它 被 输入 为 正 斜 杠 (/)。 每 个 目录 可 以 包含 子 目录 和 文件 。 

1. 特殊 目录 

在 UNIX 中 有 4 种 在 目录 结构 中 起 着 非常 重要 作用 的 特殊 目录 类 型 : 根 目录 、 主 目录 、 
工作 目录 和 父 目 录 。 ; 


根 目 录 
根 目录 是 文件 系统 层次 结构 的 最 高 层 。 它 是 整个 文件 结构 的 根 ， 因 此 它 没有 父 目录 。 在 


UNIX 的 环境 中 ， 根 目录 总 是 有 几 层 子 目 录 。 根 目录 属于 系统 管理 员 ， 只 有 系统 管理 员 能 修 
改 它 。 

主 目录 

当 首 次 登录 到 系统 中 ， 我 们 使 用 我 们 的 主 目录 。 这 个 目录 包含 我 们 在 其 中 创建 的 任何 
文件 ， 还 可 能 包含 个 人 系统 文件 。 主 目录 也 是 个 人 目录 结构 的 开始 。 每 个 用 户 都 有 一 个 主 


目录 。 
工作 目录 
工作 目录 (或 当前 目录 ) 是 在 用 户 会 话 中 在 任意 点 我 们 所 “在 ”的 目录 。 当 首次 登 


录 后 ， 工 作 目录 就 是 我 们 的 主 目录 ， 如 果 有 子 目 录 ， 在 会 话 中 ， 当 需要 时 我 们 总 是 喜欢 
从 主 目录 移 到 一 个 或 多 个 子 目录 中 。 当 我 们 改变 了 目录 ， 我 们 的 工作 目录 也 目 动 地 改 
变 了 。 

父 目 录 

父 目录 是 工作 目录 的 直接 上 层 目 录 。 当 我 们 在 我 们 的 主 目录 中 时 ， 它 的 父 目录 就 是 系统 
目录 中 的 一 个 。 | 


2. 路 径 和 路 径 名 
文件 系统 的 每 个 目录 和 文件 都 必须 有 一 个 名 字 。 如 果 我 们 仔细 检查 图 13-14， 我 们 将 


注意 到 有 些 文件 与 其 他 目录 中 的 文件 具有 相同 的 名 字 。 因 此 ， 很 显然 为 了 标识 它们 ， 我 们 
需要 用 比 文件 名 多 的 东西 。 因 此 ， 为 了 唯一 地 标识 一 个 文件 ， 我 们 需要 指明 从 根 目录 到 文 
件 的 文件 路 径 。 文 件 路 径 由 它 的 绝对 路 径 名 来 指明 ， 它 是 斜 线 字符 (/) 分 隔 的 所 有 目录 的 
列表 。 

一 个 文件 或 目录 的 绝对 路 径 名 就 像 一 个 人 的 地 址 。 如 果 我 们 仅 知 道人 的 名 字 ， 并 不 容 
易 找 到 这 个 人 。 另 一 方面 ， 妨 果 我 们 知道 人 的 名 字 、 街 地 址 、 城 市 、 州 和 国家 ， 那 么 我 们 能 
在 世界 上 找到 任何 人 。 这 个 完全 或 绝对 的 路 径 名 可 能 会 很 长 。 由 于 这 个 原因 ，UNIX 提供 了 
在 特定 情况 下 的 短路 径 名 ， 这 就 是 众所周知 的 相对 路 径 名 ， 它 是 相对 于 工作 目录 的 路 径 。 例 
如 ， 在 图 13-14 中 ， 如 果 我 们 的 工作 目录 是 staff，joan 目录 下 的 file3 可 以 通过 相对 和 绝对 
路 径 名 被 选择 : 


相对 路 径 名 : joan/file3 
绝对 路 径 名 ; /usr/staff/joan/file3 


13.6 文本 文件 与 二 进 制 文件 


在 结束 本 章 之 前 ,我 们 讨论 两 个 用 于 文件 分 类 的 术语 : 文本 文件 和 二 进 制 文件 。 存 储 在 
存储 设备 上 的 文件 是 一 个 位 的 序列 ， 可 被 应 用 程序 翻译 成 一 个 文本 文件 或 是 二 进 制 文件 ,如 


图 13-15 所 示 。 
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文件 的 文本 解释 文件 的 二 进 制 解释 





两 字 节 ， 代 表 两 个 字符 ( A 和 B ) 两 字 节 ， 代 表 一 个 数字 ( 16706 ) 
图 13-15 文件 的 文本 和 二 进 制 解释 


13.6.1 文本 文件 

文本 文件 是 一 个 字符 文件 。 在 它们 的 内 存储 器 格式 中 不 能 包含 整数 、 浮 点 数 或 其 他 数据 
结构 。 要 存储 这 些 类 型 的 数据 ， 必 须 把 它们 转换 成 对 应 的 字符 格式 。 

一 些 文件 只 能 用 字符 数据 格式 。 值 得 注意 的 是 用 于 键盘 、 监 视 器 和 打印 机 的 文件 流 ( 像 
C++ 面向 对 象 语言 中 的 输入 /输出 对 象 ) 。 这 也 是 为 什么 需要 特殊 的 函数 来 格式 化 上 述 设 备 


的 输入 或 输出 数据 。 

让 我 们 来 看 这 样 一 个 例子 ， 当 数据 (文件 流 ) 传 给 打印 机 时 ， 打 印 机 获得 8 位 数据 ， 解 
释 成 1 字 节 。 将 其 译 码 成 打印 机 的 编码 系统 (ASCII 或 EBCDIC)， 如 果 字 符 属 于 可 打印 的 
种 类 ， 它 将 被 打印 ; 否则 ， 将 执行 另外 的 操作 ， 如 打印 空白 。 然 后 ， 打 印 机 将 读 取 下 一 个 8 
位 数据 ， 依 次 重复 该 过 程 直 到 数据 流 结束 。 


13.6.2” 二进制 文件 
二 进 制 文件 是 计算 机 的 内 部 格式 存储 的 数据 集合 ， 在 这 种 定义 中 ， 数 据 可 以 是 整 型 ( 包 
括 其 他 表示 成 无 符号 整数 的 数据 类 型 ， 例 如 图 像 、 音 频 或 视频 )、 浮 点 型 或 其 他 数据 结构 ( 除 


了 文件 )。 
不 像 文 本 文件 ， 二 进 制 文件 中 的 数据 只 有 当 被 程序 正确 地 解释 时 才 有 意义 。 如 果 数 据 是 


文本 格式 的 ， 就 用 一 个 字 节 来 表示 一 个 字符 。 如 果 数 据 是 数字 格式 的 ， 则 用 两 个 或 是 更 多 字 
节 来 表示 一 个 数据 项 。 例如， 假如 个 人 计算 机 要 用 2 字 节 来 存储 一 个 整数 。 当 读 写 整数 时 ， 


计算 机 就 用 2 字 节 来 表示 。 


13.7 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
。 Forouzan, B. and Gilberg, R. Computer Science: A Structured Programming Approach 


Using C, Boston, MA: Course Technology, 2007 
。 Forouzan, B. and Gilberg, R. UNLX and Shell Programming, Pacific Grove, CA: Brooks/ 


Cole, 2003 
。 Gilberg, R. and Forouzan, B. Data Structures-A Pseudocode Approach with C, Boston, 


MA: Course Technology, 2005 


关键 术语 


absolute pathname (绝对 路 径 名 ) auxiliary storage (辅助 存储 ) 
access method ( 存 取 方 式 ) binary file (二进制 文件 ) 
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bucket ( 桶 ) linked list resolution (链表 解决 法 ) 
bucket hashing ( 桶 散 列 法 ) master file( 主 文件 ) 

collision (冲突 ) modulo division( 除 余 散 列 法 ) 

collision resolution (冲突 解决 法 ) new master file (新 主 文件 ) 

current directory (当前 目录 ) old master file ( 旧 主 文件 ) 

data file (数据 文件 ) open addressing resolution (开放 寻 址 解决 法 ) 
digit extraction method (数字 析 取 散 列 法 ) parent directory ( 父 目 录 ) 

direct hashing (直接 散 列 法 ) path (路 径 ) 

directory (目录 ) prime area ( 主 区 ) 

division remainder method ( 除 余 散 列 法 ) random access (随机 存 取 ) 

error report file (错误 报告 文件 ) relative pathname (相对 路 径 ) 

hashed file( 散 列 文件 ) root directory( 根 目录 ) 

hashing method ( 散 列 方法 ) secondary storage device (二 级 存储 设备 ) 
home address (内 部 地 址 ) sequential access (顺序 存 取 ) 

home directory ( 主 目录 ) sequential file (顺序 文件 ) 

index (索引 ) synonym (同义词 ) 

indexed file〈 索 引文 件 ) text file (文本 文件 ) 

inverted file( 倒 排 文件 ) transaction file (事务 文件 ) 

key ( 键 ) working directory (工作 目录 ) 

小 结 


。 文件 是 作为 一 个 单元 看 待 的 相关 数据 的 外 部 集合 。 文 件 的 主要 目的 是 存储 数据 。 因 为 
当 计 算 机 关机 后 ， 主 存 的 内 容 将 丢失 ， 所 以 我 们 需要 文件 用 更 持久 的 形式 存储 数据 。 
文件 被 存储 在 辅助 或 二 级 存储 设备 上 。 

。 存 取 的 方法 决定 了 记录 如 何 被 检索 : 顺序 的 或 随机 的 。 如 果 需 要 顺序 地 存 取 文 件 ， 那 
么 使 用 顺序 文件 结构 ; 如 果 需 要 存 取 一 指定 的 记录 而 无 须 检索 出 该 记录 前 的 所 有 记 
录 ， 那 么 使 用 随机 文件 结构 。 

。 顺序 文件 是 一 种 在 其 中 每 个 数据 必须 按 顺序 从 头 到 尾 一 个 接 一 个 地 进行 存 取 的 文件 。 
顺序 文件 必须 周期 性 地 更 新 ， 以 反映 出 信息 的 变化 。 与 更 新 程序 相关 联 的 文件 有 4 
个 : 新 主 文件 、 旧 主 文件 、 事 务 文 件 和 错误 报告 文件 。 

。 为 了 在 文件 中 随机 存 取 记录 ， 我 们 需要 知道 记录 的 地 址 。 通 常 有 两 种 文件 类 型 用 于 随 
机 存 取 记 录 : 索引 文件 和 散 列 文件 。 

。 索引 文件 由 数据 文件 构成 ， 该 数据 文件 是 顺序 文件 且 是 一 个 索引 。 索 引 本 身 是 一 
个 只 有 两 个 域 的 非常 小 的 文件 ， 两 个 域 是 顺序 文件 的 键 和 磁盘 上 相应 记录 的 地 址 。 
索引 是 根据 数据 文件 的 键 值 排序 的 。 在 散 列 文件 中 ， 散 列 函 数 将 键 映射 成 记录 
地 址 。 

。 散 列 可 以 采用 多 种 方法 。 在 直接 方法 中 ， 键 就 是 地 址 ， 不 需要 任何 的 算法 操作 。 在 求 
模 法 中 ， 键 被 文件 的 大 小 除 ， 得 到 的 余数 加 上 1 就 是 地 址 。 在 数字 析 取 散 列 法 中 ， 选 
择 的 数字 是 从 键 中 被 析 取 出 来 的 ， 用 作 地址。 

。 在 散 列 过 程 中 ， 有 可 能 会 出 现 多 个 键 值 散 列 至 文件 中 的 相同 地 址 ， 这 样 就 产生 了 冲 
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突 。 我 们 讨论 了 几 种 冲突 解决 方法 : 开放 寻 址 解决 法 、 链 表 解 决 法 和 桶 散 列 法 。 

。 目录 是 大 多 数 操作 系统 都 提供 的 用 来 组 织 文件 的 。 目 录 的 作用 就 像 文件 柜 中 的 文件 
夹 。 但 是 ， 在 大 多 数 操作 系统 中 的 目录 被 表示 成 为 一 个 包含 关于 其 他 文件 的 信息 的 特 
殊 文件 类 型 。 

。 存储 在 存储 设备 中 的 文件 是 一 个 二 进 制 位 的 序列 ， 它 可 以 被 应 用 程序 翻译 成 文本 文件 
或 二 进 制 文件 。 文 本 文件 是 字符 的 文件 。 二 进 制 文件 是 使 用 计算 机 内 部 格式 存储 的 数 
据 集合 。 


13.8 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建 议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 

Q13-1 通常 文件 有 哪 两 种 存 取 方式 ? 

Q13-2 新 主 文件 和 旧 主 文件 之 间 是 什么 关系 ? 

Q13-3 在 顺序 文件 更 新 时 ， 事 务 文件 的 作用 是 什么 ? 
Q13-4 ”描述 随机 文件 存 取 的 地 址 函数 。 

Q13-5 在 索引 文件 中 ， 索 引 是 如 何 关 联 数据 文件 的 ? 
Q13-6 在 文件 直接 散 列 法 中 键 和 地 址 之 间 是 什么 关系 ? 
Q13-7 ”在 文件 除 余 散 列 法 中 键 和 地 址 之 间 是 什么 关系 ? 
Q13-8 在 文件 数字 析 取 散 列 法 中 键 和 地 址 之 间 是 什么 关系 ? 
Q13-9 给 出 三 种 解决 冲突 的 方法 。 

Q13-10 ”文本 文件 和 二 进 制 文件 之 间 的 区 别 是 什么 ? 


练习 题 
P13-1 图 13-16 给 出 了 旧 主 文件 和 事务 文件 ， 找 出 新 主 文件 。 如 果 有 错误 ， 创 建 错误 报告 文件 。 





图 13-16 练习 题 
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为 表 13-1 创建 索引 文件 。 
表 13-1 练习 题 2 


US 


P13-3 


P13-4 
P13-5 


P13-6 


P13-7 


P13-8 
P13-9 


P13-10 
P13-11 


P13-12 
P13-13 
P13-14 


P13-15 


P13-16 


一 个 文件 使 用 求 模 法 ， 且 除数 为 41 ， 下 列 键 的 地 址 分 别 为 多 少 ? 

a. 14232 b. 12560 c. 13450 d. 15341 

在 平方 中 值 散 列 法 中 ， 键 首先 平方 ， 然 后 取 结 果 的 中 间 值 作为 地 址 。 用 这 种 方法 从 下 列 键 中 
选择 地 址 ， 用 数字 3、4 (从 左边 )。 

a. 142 b. 125 c. 134 d. 153 

在 折合 移 位 散 列 法 中 ， 键 被 分 成 几 部 分 ， 几 部 分 相 加 后 得 到 地 址 。 用 这 种 方法 从 下 列 键 中 找 
出 地 址 。 划 分 键 为 两 位 数字 部 分 ， 再 把 它们 相 加 得 到 地 址 。 

a. 1422 b. 1257 c. 1349 d. 1532 

在 折 琶 边界 散 列 法 中 ， 键 将 被 划分 ， 左 边 和 右边 将 被 倒转 并 加 到 地 址 的 中 间 部 分 去 得 到 地 址 。 
用 这 种 方法 从 下 列 键 中 找 出 地 址 。 划 分 键 为 两 位 数字 部 分 ,倒转 第 一 和 第 三 部 分 再 将 它们 加 


起 来 获得 地 址 。 

a. 142234 b. 125711 c. 134914 d. 153213 

用 求 模 法 从 下 列 键 中 找到 地 址 ， 文 件 大 小 为 411 ， 如 果 有 冲突 ， 用 开放 寻 址 来 解决 。 画 一 个 图 
给 出 记录 的 位 置 。 

a. 10278 ~ b. 08222 c. 20553 d. 17256 


用 链表 解决 法 在 把 第 7 题 重 做 一 遍 。 
文件 处 理 中 的 一 个 常见 算法 是 合并 两 个 按键 值 排序 的 顺序 文件 ， 产 生 一 个 新 的 顺序 文件 ， 也 
是 按键 值 排序 的 。 如 果 每 个 文件 在 结尾 处 都 有 一 个 虚拟 的 记录 ， 该 虚拟 记录 具有 比 文件 中 
任何 键 值 都 大 的 唯一 的 键 值 ， 那 么 合并 算法 可 以 变 得 非常 简单 。 这 唯一 的 键 值 被 称 为 哨兵 。 
在 这 假想 的 情况 下 ， 就 没有 必要 去 检查 文件 的 EOF 标识 。 画 出 在 这 种 情况 下 合并 两 文件 的 
UML 图 。 
用 伪 码 写 出 练习 题 P13-9 的 算法 。 
如 果 两 个 文件 有 练习 题 P13-9 所 讨论 的 哨兵 值 ， 画 出 基于 事务 文件 更 新 一 个 顺序 文件 的 
UML 图 。 
用 伪 码 写 出 练习 题 P13-11 的 算法 。 
如 果 在 处 理 过 程 中 我 们 能 人 工 建 立 哨兵 ， 那 么 练习 题 P13-9 中 假想 的 情况 就 可 以 被 应 用 到 真 
实 的 情况 中 (文件 带 有 一 个 EOF 标识 )。 画 出 合并 两 个 带 有 EOF 标识 而 不 是 哨兵 的 顺序 文件 
的 UML 图 。 
用 伪 码 写 出 练习 题 P13-13 的 算法 。 
如 果 两 个 文件 使 用 EOF 标识 而 不 是 哨兵 ， 画 出 基于 事务 文件 更 新 顺序 文件 的 UML 图。 使 用 
练习 题 P13-13 中 的 概念 。 
用 伪 码 写 出 练习 题 P13-15 的 算法 。 
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数 据 库 


本 章 我 们 讨论 数据 库 和 数据 库 管理 系统 (DBMS)。 我 们 给 出 数据 库 管理 系统 的 三 层 结 
构 ， 重 点 讲解 关系 数据 库 模型 并 举例 说 明 其 操作 。 接 着 ， 介 绍 一 种 在 关系 数据 库 上 使 用 的 语 
言 (结构 化 查询 语言 )。 最 后 ， 简 要 介绍 数据 库 设计 和 其 他 的 数据 库 模 型 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 

。 定义 数据 库 和 数据 库 管 理 系 统 ， 并 描述 DBMS 的 组 成 ; 

。 描述 基于 ANSI/SPARC 定义 的 DBMS 的 体系 结构 ; 

。 定义 三 种 传统 的 数据 库 模 型 : 层次 、 网 络 和 关系 ; 

。 描述 关系 模型 和 关系 ; 

。 理解 关系 数据 库 中 的 操作 ， 这些 操作 在 SQL 中 有 相应 的 命令 ; 

。 描述 数据 库 设 计 的 步骤 ; 

。 说 明 ERM 和 E-R 图 ,解释 这 种 模型 中 的 实体 和 关系 ; 

。 说 明正 规 化 的 层次 和 理解 正则 关系 的 基本 原理 ; 

。 列 出 除 关系 模型 外 其 他 的 数据 库 类 型 。 


14.1 引言 | 

数据 的 存储 传统 上 是 使 用 单独 的 没有 关联 的 文件 ， 有 时 称 为 平面 文件 。 在 过 去 ， 组 织 中 
的 每 个 应 用 程序 都 使 用 自己 的 文件 。 例 如 ， 在 一 所 大 学 中 ， 每 个 部 门 可 能 会 有 他 们 自己 的 文 
件 集合 ， 成 绩 记录 办 公 室 保存 了 关于 学 生 信息 和 他 们 成 绩 的 文件 ;经 济 资助 办 公 室 保存 了 他 
们 自己 的 关于 需要 经 济 资助 完成 学 业 的 学 生 的 文件 ;调度 办 公 室 保存 了 教授 的 姓名 和 他 们 所 
教 的 课程 ;工资 部 门 保存 了 他 们 自己 的 关于 全 体 教 职 工 (包括 教授 ) 的 文件 ， 等 等 。 但 是 ， 
现在 所 有 这 些 平面 文件 都 被 组 合成 个 实体 一个 全 大 学 的 数据 库 。 


14.1.1 定义 
虽然 要 给 出 一 个 广泛 接受 的 数据 库 定 义 有 一 些 困 难 ， ha 


pA 2 水 xf > 
的 集合 。 i 


”数据 库 是 一 个 组 织 内 被 应 用 程序 使 用 的 逻辑 相 一 致 的 相关 数据 的 集合 。 





14.1.2 数据 库 的 优点 
与 平面 文件 系统 相 比 ， 我 们 可 以 说 出 数据 库 系 统 的 以 下 几 个 优点 。 


1. 元 余 较 少 
平面 文件 系统 中 存在 着 大 量 的 元 余 ， 例 如 ， 在 关于 大 学 的 一 个 平面 文件 系统 中 ， 教 授 和 


学 生 的 名 字 就 保存 在 多 个 文件 中 。 
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2. 避免 不 一 致 性 : 
如 果 相 同 的 信息 被 存储 在 多 个 地 方 ， 那 么 对 数据 的 任何 修改 需要 在 数据 存储 的 所 有 地 方 


进行 。 例 如 ， 一 个 女 学 生 结婚 了 ， 并 接受 了 她 丈夫 的 姓 ， 那 么 这 个 学 生 的 姓 需要 在 所 有 包含 
该 学 生 信息 的 地 方 做 修改 。 一 不 小 心 很 容易 造成 数据 的 不 一 致 性 。 


3. 效率 

数据 库 通 常 比 平面 文件 系统 的 效率 要 高 得 多 ， 因 为 数据 库 中 一 条 信息 存储 在 更 少 的 
地 方 。 

4. 数据 完整 性 

数据 库 系统 更 容易 维护 数据 的 完整 性 (参见 第 16 章 )， 因 为 数据 信息 存储 在 更 少 的 
地 方 。 

5. 机 密 性 


如 果 数 据 是 集中 存放 在 一 个 地 方 ， 就 更 容易 维护 信息 的 机 密 性 。 


14.1.3 数据库 管理 系统 

数据 库 管 理 系统 是 定义 、 创 建 和 维护 数据 库 的 一 种 工具 。DBMS 也 允许 用 户 来 控制 数 
据 库 中 数据 的 存 取 。 数 据 库 管理 系统 由 5 
部 分 构成 : 硬件 、 软 件 、 数 据 、 用 户 和 规 
程 (图 14-1 )。 

1. 硬件 

硬件 是 指 允 许 存 取 数 据 的 实际 的 计算 
机 硬件 系统 。 例 如 ， 用 户 终端 、 硬 盘 、 主 机 和 工作 站 ， 都 被 认为 是 DBMS 的 硬件 组 成 部 分 。 

2. 软件 

软件 是 指 允 许 用 户 存 取 、 维 护 和 更 新 物理 数据 的 实际 程序 。 另 外 ， 软 件 工具 还 可 以 控制 
哪些 用 户 可 以 对 数据 库 中 的 哪 部 分 数据 进行 存 取 。 

3. 数据 

数据 库 中 的 数据 存储 在 物理 存储 设备 上 。 在 数据 库 中 ， 数据 是 独立 于 软件 的 一 个 实体 。 
这 种 独立 使 得 组 织 可 以 在 不 改变 物理 数据 及 其 存 取 方式 的 情况 下 ， 更 换 所 应 用 的 软件 。 如 果 
组 织 决定 使 用 数据 库 管 理 系 统 ， 那 么 该 组 织 所 需要 的 所 有 信息 必须 存放 在 一 个 实体 中 ， 从 而 
便于 DBMS 中 的 软件 存 取 。 

4. 用 户 

用 户 这 个 术语 在 数据 库 管理 系统 中 有 广泛 的 定义 。 我 们 可 以 将 用 户 分 为 两 类 : 最 终 用 户 
和 应 用 程序 。 


最 终 用 户 
最 终 用 户 指 直接 从 数据 库 中 获取 信息 的 用 户 。 最 终 用 户 又 可 分 为 两 类 : 数据 库 管理 员 


(DBA) 和 普通 用 户 。 数 据 库 管理 员 拥有 最 大 的 权限 ， 可 以 控制 其 他 用 户 以 及 他 们 对 数据 库 
的 存 取 。 数 据 库 管 理 员 可 以 将 他 的 一 些 特权 授予 其 他 用 户 并 保留 随时 收回 特权 的 能 力 。 而 另 
一 方面 ， 普 通用 户 只 能 使 用 部 分 数据 库 和 有 限 的 存 取 。 

应 用 程序 

数据 库 中 数据 的 其 他 使 用 者 就 是 应 用 程序 。 应 用 程序 需要 存 取 和 处 理 数 据 。 例 如 ， 工 资 
单 应 用 程序 就 要 存 取 数 据 库 中 的 数据 来 产生 月 底 的 工资 单 。 





14-1 DBMS 组 成 
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5. 规程 
数据 库 管理 系统 的 最 后 一 个 部 分 ， 是 必须 被 明确 定义 并 为 数据 库 用 户 所 遵循 的 规程 或 规 


则 的 集合 。 


14.2 数据库 体系 结构 
美国 国家 标准 协会 /标准 计划 和 需求 委员 会 (ANSISPARC) 为 数据 库 管理 系统 建立 了 
三 层 体系 结构 ， 内 层 、 概 念 层 和 外 层 (图 14-2 ) 。 


14.2.1 内 层 EN oe 

a 

内 层 决定 了 数据 在 存储 设备 中 的 实际 位 置 。 这 个 层 (a4 

次 处 理 低层 次 的 数据 存 取 方 法 和 如 何在 存储 设备 间 传输 字 
节 。 换 句 话 说， 内 层 直接 与 硬件 交互 。 


14.2.2 概念 层 

概念 层 定义 数据 的 逻辑 视图 。 在 该 层 中 定义 了 数据 
模式 。 数 据 库 管理 系统 的 主要 功能 (如 查询 ) 都 在 该 层 。 
数据 库 管 理 系统 把 数据 的 内 部 视图 转化 为 用 户 所 看 到 的 
外 部 视图 。 概 念 层 是 中 介 层 ， 它 使 得 用 户 不 必 与 内 层 打 图 14 数据 让 亿美 结 上 
交道 。 
14.2.3 ”外 层 

外 层 直接 与 用 户 (最 终 用 户 或 应 用 程序 ) 交互 。 它 将 来 自 概念 层 的 数据 转化 为 用 户 所 熟 
悉 的 格式 和 视图 。 


14.3 数据库 模型 
数据 库 模型 定义 了 数据 的 逻辑 设计 ， 它 也 描述 了 数据 的 不 同 部 分 之 间 的 联系 。 在 数据 库 
设计 发 展 史 中 ， 曾 使 用 过 三 种 数据 库 模 型 : 层次 模型 、 网 状 模型 和 关系 模型 。 


14.3.1 层次 模型 


层次 模型 中 ， 数 据 被 组 织 成 一 棵 倒置 的 树 。 每 一 个 实体 可 以 有 不 同 的 子 节点 ， 但 只 能 有 
一 个 父 节 点 。 层 次 的 最 顶端 有 一 个 实体 ，. 称 为 根 。 图 14-3 给 出 了 层次 模型 的 逻辑 视图 。 由 


于 层次 模型 已 经 过 时 ， 我 们 不 再 做 过 多 的 叙述 。 





DEPARTMENT 








coURsEs No [Name [ Une | ~ CD | mee [ous) supeNTs 
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图 14-3 ”层次 模型 
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14.3.2 ”网 状 模型 
网 状 模型 中 ， 实 体 通过 图 来 组 织 ， 图 中 的 部 分 实体 可 通过 多 条 路 径 来 访问 (图 14-4 ) 。 


这 里 没有 层次 关系 。 由 于 该 模型 已 经 过 时 ， 我 们 也 不 再 做 过 多 的 描述 。 





图 14-4 网 状 模型 


14.3.3 ”关系 模型 
关系 模型 中 ， 数 据 组 织 成 称 为 关系 的 二 维 表 ， 这 里 没有 任何 层次 或 网 络 结构 强加 于 数据 


上 ， 但 表 或 关系 相互 关联 ， 如 图 14-5 所 示 。 


PROFESSORS 


Narme 0 





图 14-5 描述 大 学 的 关系 模型 示例 
如 今 ， 关系 模 型 是 数据 库 设 计 中 最 常用 的 模型 。 我 们 将 在 本 章 中 花费 大 部 分 篇 幅 去 介绍 
它 。 在 本 章 的 最 后 一 节 ， 将 简要 地 介绍 另外 两 种 常用 的 、 派 生 于 关系 模型 的 数据 库 模型 ， 分 
布 式 模型 和 面向 对 象 模型 。 


14.4 关系 数据 库 模 型 
在 关系 数据 库 管理 系统 (RDBMS) 中 ， 数 据 是 通过 关系 的 集合 来 表示 的 。 


14.4.1 关系 

从 表面 上 看 ， 关 系 就 是 二 维 表 。 在 关系 数据 库 管 理 系 统 中 ， 数 据 的 外 部 视图 就 是 关系 或 
表 的 集合 ， 但 这 并 不 代表 数据 以 表 的 形式 存储 。 数 据 的 物理 存储 与 数据 的 逻辑 组 织 的 方式 毫 
无 关系 。 图 14-6 给 出 了 一 个 关系 的 例子 。 

关系 数据 库 管 理 系统 中 的 关系 有 下 列 特征 : 
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。 名 称 : 在 关系 数据 库 管 理 系 统 中 ， 每 一 种 关系 都 具有 唯一 的 名 称 。 

。 属 性: 关系 中 的 每 一 相册 泛 在 生 中 弟 洲 的 性 
示 了 存储 在 该 列 下 的 数据 的 含义 。 表 中 的 每 一 列 在 关系 范围 内 有 唯一 的 名 称 。 关 系 中 
属性 的 总 数 称 为 关系 的 度 。 图 14-6 中 的 关系 的 度 为 3， 注 意 属 性 名 并 不 存储 在 数据 
库 中 ， 概 念 层 中 使 用 属性 给 每 一 列 赋予 一 定 的 意义 。 

元 组 : 关系 中 的 行 叫 元 组 。 元 组 定义 了 一 组 属性 值 。 关 系 中 元 组 的 个 数 叫 关 
系 的 基数 。 当 增加 或 减少 元 组 时 ， 关 系 的 基数 就 会 改变 。 这 就 实现 了 动态 数 
据 库 。 


注意 : 关系 的 名 称 
是 COURSES 





COURSES 


图 14-6 关系 的 一 个 例子 


14.4.2 关系 的 操作 

在 关系 数据 库 中 ， 我 们 可 以 定义 一 些 操作 来 通过 已 知 的 关系 创建 新 的 关系 。 本 节 中 共 定 
义 了 9 种 操作 : 插入、 删除、 更新、 选择、 投影 、 连 接 、 并 、 交 和 差 。 我 们 并 不 抽象 地 讨论 
这 些 操 作 ， 而 是 把 它们 描述 成 在 数据 库 查 询 语言 SQL (结构 化 查询 语言 ) 中 的 定义 。 

1. 结构 化 查询 语言 

结构 化 查询 语言 是 美国 国标 协会 (ANSI) 和 国际 标准 化 组 织 (ISO) 用 于 关系 数据 库 的 
标准 化 语言 。 这 是 一 种 描述 性 (不 是 过 程 化 ) 的 语言 ， 这 意味 着 使 用 者 不 需要 一 步 步 地 编写 
详细 的 程序 而 只 需 声 明 它 。 结 构 化 查询 语言 于 1979 年 首次 被 Oracle 公司 实现 。 之 后 有 了 更 
多 的 新 版 本 。 

2. 插 入 

插入 是 一 元 操作 ， 它 应 用 于 一 个 关系 。 其 作用 是 在 关系 中 插入 新 的 元 组 。 插 入 操作 使 用 
如 下 的 格式 : 

insert into RELATION-NAME Values (……… 

values 子 句 定义 了 要 插入 的 相应 元 组 的 所 有 属性 。 例 如 ， 图 14-7 显示 了 这 个 操作 是 如 
何 被 应 用 于 一 个 关系 的 。 注 意 , 在 SQL 语言 中 ， 字 符 串 的 值 是 要 用 引号 括 起 来 的 ， 而 数值 


就 不 需要 。 


Networking | 5 





图 14-7 插入 操作 的 一 个 例子 
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3. 删除 
删除 也 是 一 元 操作 。 根 据 要 求 删 除 表 中 相应 的 元 组 。 删 除 操 作 使 用 如 下 格式 : 


delete Erom RELATION-NAME where criteria 
删除 的 条 件 是 由 where 子 句 定义 的 。 例 如 ， 图 14-8 显示 了 如 何 从 关系 课程 (COURSES) 
中 删除 一 个 元 组 ， 注 意 条 件 是 No = "CIS19"。 


COURSES 
Course=~Naime Unit 


Jntro to C 
Intro to Java 
UNIX 
Networking 
TCP/IP 






COURSES 
No Course-Name Unit 


Intro to C 
Intro to Java | 5 
Networking | 3 



















delete from COURSES 
where No= "CIS19” 













图 14-8 删除 操作 的 一 个 例子 


4. 更 新 
更 新 也 是 一 元 操作 ， 它 应 用 于 一 个 关系 ， 用 来 更 新 元 组 中 的 部 分 属性 值 。 更 新 操作 使 用 
如 下 格式 ; 


Update RELATION-NAME 
set attributel=valuel, attribute2=value2,'" 


where criteria 
要 改变 的 属性 定义 在 set 子 句 中 ， 更 新 的 条 件 定 义 在 where 子 句 中 。 例 如 ， 图 14-9 显示 
了 一 个 元 组 中 的 Unit (属性 ) 的 数目 是 如 何 被 更 新 的 。 


COURSES 
Course-Name Unit 


COURSES 
Course-Name Unit 
Intro to C 


Jntro to C 
update _ COURSES 
Intro to Java 


Intro to Java eetljnit=6 


UNIX where No= “CIS5S1” UNIX 
Networking 
TEP/IP 


Networking 
TCP/IP 





图 14-9 更 新 操作 的 一 个 例子 


5. 选择 

选择 也 是 一 元 操作 ， 它 应 用 于 一 个 关系 并 产生 另外 一 个 新 关系 。 新 关系 中 的 元 组 ( 行 ) 
是 原 关 系 元 组 的 子 集 。 选 择 操 作 根 据 要 求 从 原 关 系 中 选择 部 分 元 组 。 选 择 操作 使 用 如 下 格式 : 

select * 


from RELATION-NAME 
where criteria 


星 号 (*) 表示 所 有 的 属性 都 被 选择 。 图 14-10 给 出 了 选择 操作 的 一 个 例子 。 该 图 中 给 
出 了 一 个 规模 小 的 院 系 所 提供 的 课程 ， 选 择 操作 允许 用 户 只 选择 含有 5 个 单元 的 课程 。 

6. 投影 

投影 也 是 一 元 操作 ， 它 应 用 于 一 个 关系 并 产生 另外 一 个 新 关系 。 新 表 中 的 属性 ( 列 ) 是 
原 关 系 中 属性 的 子 集 。 投 影 操 作 所 得 到 的 新 关系 中 的 元 组 属性 减少 ， 但 元 组 ( 行 ) 的 数量 保 
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持 不 变 。 投 影 操作 使 用 如 下 的 格式 : 


select attribute-list 
from RELATION-NAME 


COURSES 







No Course-Name Unit 

命令 
Intro to C 

Seject >” 

Intro to Java from COURSES Intro to C 
UNIX where Unit =5 Intro to Java 
Networking Networking 
TCP/IP 





No “Course-Name Unit 


















图 14-10 ”选择 操作 的 一 个 例子 


新 关系 的 列 名 被 显 式 地 列 出 。 图 14-11 给 出 了 一 个 投影 操作 的 例子 ， 即 产生 仅 两 列 的 一 
个 关系 。 


COURSES 
No Course-Name Unit 


Intro to C 


Intro to Javal 5 select No. Unit 


UNIX from COURSES 
Networking | 5 
TCP/IP 


图 14-11 投影 操作 的 一 个 例子 





7. 连接 
连接 是 二 元 操作 ， 它 基于 共有 的 属性 把 两 个 关系 组 合 起 来 。 连 接 操 作 使 用 如 下 格式 : 
select attribute~list 


from RELATION], RELATION2 


where criteria 


属性 列表 是 两 个 输入 关系 的 属性 组 合 。 条 件 明确 地 定义 了 作为 相同 属性 的 属性 。 连 接 
操作 十 分 复杂 并 有 很 多 变化 。 图 14-12 给 出 了 关系 COURSES 和 关系 TAUGHT-BY 的 连接 ， 
生成 了 一 个 信息 更 加 全 面 的 关系 ,包括 教授 的 名 字 。 这 里 ， 共 有 的 属性 是 课程 号 (No)。 


COURSES TAUGHT-BY 


No Course-Name Unit No Professor 


Intro to C ] 

select No.Course-name Unit Professor 
Intro to Java from COURSES-TAUGHT-BY 
UNIX Where COURSE.No= TAUGHT-BY.No: 










Networking 
TCP/IP 







No Course-Name Unit Professor 
Lee 
Lu 
Walter 
Lu 
Lee 


图 14-12 ”连接 操作 的 一 个 例子 









Intro to C 
Intro to Java 
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8. 并 
并 也 是 二 元 操作 ， 它 将 两 个 关系 合并 成 一 个 新 的 关系 。 不 过 这 里 对 两 个 关系 有 一 个 限 


制 ， 即 它们 必须 有 相同 的 属性 。 并 操作 ， 类 似 于 集合 论 中 的 定义 ， 新 关系 中 的 每 一 个 元 组 或 
者 在 第 一 个 关系 、 第 二 个 关系 ， 或 者 在 两 个 关系 中 缘 有 。 并 操作 使 用 如 下 格式 : 

select * 

from RELATION] 


select * 
from RELATION2 


这 里 星 号 仍然 代表 所 有 属性 都 被 选择 。 例 如 ， 图 14-13 给 出 了 两 个 关系 : 左上 是 CIS15 
的 花 名 和 册 ， 右 上 是 CIS52 的 花 名 册 。 结 果 就 是 一 个 关系 ， 关 系 中 列 出 了 所 有 包含 在 CIS15、 
CIS52 花 名 册 中 ， 或 者 两 个 花 名 册 中 都 有 的 学 生 。 


CIS1S-Roster 


Student-ID F-Name L-Name 
















SQL 命令 CISS2-Roster 


Ci nt if NY 1 _Nia 
Student-ID 上 -Name LL-Name 







145-67-6754 | John | Brown 人 的 css 145-67-6754| John Brown 

hab re 人 select * 232-56-5690| George | Yellow 
. e reen from ClS52-Roster 42-88- i | 

ps Purple 342-88-9999 | Rich White 






上 LL-Name 





459-98-6789 


图 14-13 ”并 操作 的 一 个 例子 


9. 交 

交 也 是 二 元 操作 ， 它 对 两 个 关系 进行 操作 ， 创 建 一 个 新 关系 。 和 并 操作 一 样 ， 进 行 交 操 
作 的 两 个 关系 必须 有 相同 的 属性 。 交 操作 ， 类 似 于 集合 论 中 的 定义 ， 新 关系 中 的 每 一 个 元 组 
必须 是 两 个 原 关 系 中 共有 的 成 员 。 交 操作 使 用 如 下 格式 : 

select * 

from RELATION]1 

intersection 


Select * 
from RELATION2 


这 里 的 星 号 仍然 表示 所 有 的 属性 被 选择 。 例 如 ， 图 14-14 中 的 交 操作 显示 所 有 的 属性 被 
选择 。 

例如 ， 图 14-14 给 出 了 两 个 输入 关系 ， 经 过 交 操 作 后 ， 给 出 了 既 在 CIS15 花 名 册 又 在 
CIS52 花 名 册 中 的 学 生 。 

10. 差 

差 也 是 二 元 操作 ， 它 应 用 于 具有 相同 属性 的 两 个 关系 。 生 成 的 关系 中 的 元 组 是 那些 存在 
于 第 一 个 关系 中 而 不 在 第 二 个 关系 中 的 元 组 。 差 操作 使 用 如 下 格式 : 


和 划 氛 翌 





select * 

from RELATION] 
minus 

select * 

from RELATION2 


ClIS15-Roster CIS52-Roster 














Student-ID F-Name LL-Name ey Student-ID F-Name 


Brown from ClS 15-Roster 145-67-6754 
infersection 




















145-67-6754 John Brown 



























232-56-569 ; ， 

32-56-5690 George Yellow A 232-56-5690 Yellow 
345-89-6580 Anne Green from ClS52-Roster 342-88-9999 i 
459-98-6789 Ted Purple eb Wi 






Student-jD F-Name L-Name 


145-67-6754 Brown 
232-56-5690 Yellow 


图 14-14 ” 交 操 作 的 一 个 例子 











John 


George 









这 里 星 号 仍然 表示 所 有 的 属性 被 选择 。 例 如 ， 因 14-15 给 出 于 两 个 答 入 关系 ， 头 娘 作 的 
结果 为 那些 在 CIS15 花 名 册 而 不 在 CIS52 花 名 册 中 的 学 生 


CIS13-Roster 


CIS$2-Roster 
Student-|D 











命令 


Select ” 
Brown from LIlS15-Roster 145-67-6754 


Yellow minus 232-56-5690 


Green select ” 
from CIS52-Roster 342-88-9999 
Purple 















Student-|D FF-Name L-Name F-Name lL-Name 




















John Brown 
George 


Rich 


145-67-6754 
232-56-5690 
345-89-6580 
459-98-6789 
































Yellow 
White 













Student-ID F-Name LL-Name 


Green 
Purple 


图 14-15 ” 差 操 作 的 一 个 例子 










Anne 
Ted 


345-89-6500 
459-98-6789 










11. 语句 的 组 合 
SQL 语 育 允许 我 们 组 合 前 面 介绍 的 语言 ， 从 数据 库 中 抽取 出 更 复杂 的 信息 。 


14.5 数据库 设计 

数据 库 的 设计 是 一 个 元 长 且 只 pray 完成 的 任务 。 第 一 步 通常 涉及 与 数据 
库 潜 在 用 户 的 面谈 (例如 ， 在 一 个 大 学 里 )， 去 收集 需要 存储 的 信息 和 每 个 部 门 的 存 取 需求 。 
第 二 步 就 是 建立 poi 义 了 其 中 一 些 信 息 需 要 维护 的 实体 、 


这 些 实体 的 属性 和 实体 间 的 关系 。 
设计 的 下 一 步 是 基于 使 用 的 数据 库 类 型 的 。 在 关系 数据 库 中 ， 下 一 步 就 是 建立 基 
ERM 的 关系 和 规范 化 这 些 关系 。 的 


些 概念 9 
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14.5.1 实体 关系 模型 

在 这 一 步 ， 数 据 库 设 计 者 建立 了 实体 关系 ( E-R) 图 来 表示 那些 其 信息 需要 保存 的 实体 
和 实体 间 的 关系 。E-R 图 使 用 了 多 种 几何 图 形 ， 但 这 里 只 使 用 其 中 的 少 部 分 : 

。 矩形 表示 实体 集 。 

。 椭圆 形 表示 属性 。 

。 黄 形 表 示 关 系 集 。 

。 线 连接 属性 和 实体 集 以 及 实体 集 和 关系 集 。 


CV 图 14-16 显 示 了 一 个 非常 简单 的 E-R 图 ， 其 中 有 三 个 实体 集 及 其 属性 和 实 
体 集 间 的 关系 。 






PROFESSOR 


Name 





图 14-16 E-R 图 中 的 实体 、 属 性 和 关系 


关系 (用 菱形 表示 的 ) 可 以 是 一 对 一 、 一 对 多 、 多 对 一 和 多 对 多 。 在 图 14-16 中 ， 
STUDENT 集合 和 COURSE 集合 间 的 关系 是 一 对 多 的 关系 (在 图 中 用 1-M 来 显示 )， 这 意 
味 着 STUDENT 集合 中 的 一 个 学 生 可 以 选修 COURSE 集合 中 的 多 门 课 程 。 如 果 我 们 把 选课 
(takes) 的 关系 改 成 被 选 (taken) 的 关系 ,那么 STUDENT 集合 和 COURSE 集合 间 的 关系 就 
是 多 对 一 的 关系 。 

图 14-16 中 有 些 属性 被 隐藏 了 。 在 每 个 集合 中 都 有 被 看 作 该 集合 的 关键 字 的 属性 。 注 意 
关系 集合 也 可 以 有 实体 的 ， 但 是 为 了 使 讨论 简明 ， 我 们 这 里 的 关系 并 没有 显示 出 属性 。 


14.5.2 从 E-R 图 到 关系 


在 E-R 图 完成 后 ， 关 系数 据 库 中 的 关系 就 能 建立 了 。 

1. 实体 集 上 的 关系 

对 于 E-R 图 中 的 每 个 实体 集 ， 我 们 都 创建 一 个 关系 ( 表 )， 这 些 关系 具有 n 个 列 ， 对 应 
于 这 个 集合 所 定义 的 个 属性 。 

我 们 可 以 有 三 个 关系 ( 表 )， 分 别 对 应 于 图 14-16 中 所 定义 的 实体 集 ， 如 图 14-17 
所 示 。 


PROFESSOR 





图 14-17 对 应 于 图 14-16 中 实体 集 的 关系 


条 据 座 





2. 关系 集 上 的 关系 

对 于 E-R 图 中 的 每 个 关系 集 ， 我 们 都 创建 一 个 关系 ( 表 )， 这 个 关系 中 有 一 个 列 对 应 于 
这 个 关系 所 涉及 的 实体 集 的 关键 字 ， 如 果 关 系 有 属性 (本 例 中 没有 )， 这 个 关系 还 可 以 有 关 
系 本 身 的 属性 对 应 的 列 。 

C0 旭 14-16 中 有 两 个 关系 集 teaches 和 takes， 每 一 个 连接 两 个 实体 集 ， 这 些 关 
系 集 的 关系 被 加 到 先前 的 实体 集 关 系 中 ， 如 图 14-18 所 示 。 





Ee 


图 14-18 图 14-16 中 的 E-R 图 对 应 的 关系 


14.5.3 ”规范 化 


规范 化 是 一 个 处 理 过程 ， 通 过 此 过 程 给 定 的 一 组 关系 转化 成 一 组 具有 更 坚固 结构 的 新 关 
系 。 规 范 化 允许 数据 库 中 表示 的 任何 关系 ， 要 允许 像 SQL 这 样 的 语言 去 使 用 由 原子 操作 组 
成 的 恢复 操作 ， 要 移 除 插 和 人 入、 删除 和 更 新 操作 中 的 不 规则 ， 要 减少 当 新 的 数据 类 型 被 加 入 时 
对 数据 库 重建 的 需要 。 | 

规范 化 过 程 定 义 了 一 组 层次 范式 (NF)。 多 种 范式 已 经 被 提出 ,包括 INF、2NF、3NF、 
BCNF (Boyce-Codd 范式 )、4NF、PJNF (Projection/Joint 范式 ) 和 5NF 等 。 这 些 范式 ( 1NF 
除外 ) 的 讨论 涉及 函数 依赖 性 的 讨论 ， 这 是 一 门 理论 的 学 科 ， 超 出 了 本 书 的 范围 ， 这 里 我 们 
只 是 从 兴趣 出 发 简单 地 讨论 其 中 的 一 些 。 但 是 ， 有 一 点 要 知道 ， 那 就 是 这 些 范式 形成 了 一 个 
层次 结构 ， 换 言 之 ， ana 3NF， 那 它 首 先 应 该 是 2NF。 

1. 第 一 范式 ( 1NF) 

当 我 们 把 实体 或 关系 转换 成 表格 式 的 关系 时 可 能 有 些 关 系 的 行 或 列 的 交集 有 多 个 值 。 
例如 ， 在 图 14-18 的 一 组 关系 中 ， 其 中 有 两 个 关系 teaches 和 takes 就 不 是 第 一 范式 。 一 个 教 
授 可 以 教授 多 门 课程 ， 而 一 个 学 生 也 可 以 修 多 门 课 程 。 这 两 个 关系 可 以 通过 重复 有 问题 的 行 
来 进行 规范 化 。 

图 14-19 显示 了 关系 teaches 是 如 何 规范 化 的 ， 一 个 不 是 第 一 范式 的 关系 可 能 会 遇 到 许 
多 问题 。 例 如 ， 如 果 ID 为 8256 的 教授 不 再 教授 课程 CIS15， 那 我 们 需要 在 关系 teaches 中 
删除 这 个 教授 记录 的 一 部 分 ， 在 数据 库 系统 中 ， 我 们 总 是 删除 一 整 条 记录 ， 而 不 是 一 条 记录 
的 一 部 分 。 


2. 第 二 范式 ( 2NF) 
在 每 个 关系 中 ， 我 们 需要 有 一 个 关键 字 ( 称 为 主键 )， 所 有 其 他 的 属性 ( 列 值 ) 都 依赖 


于 它 。 例 如 ， 如 果 学 生 的 ID 给 定 后 ， 就 应 该 有 可 能 找到 学 生 的 姓名 。 但 是 ， 当 关系 是 根据 
E-R 图 建立 时 ， 我 们 可 能 有 一 些 复合 的 关键 字 (两 个 或 两 个 以 上 关键 字 的 组 合 )。 在 这 种 情 
况 下 ， 如 果 每 一 个 非 关 键 字 属性 都 依赖 于 整个 复合 关键 字 ， 那 么 这 个 关系 就 是 第 二 范式 的 。 


TS 一 个 交集 只 有 一 个 什 





a) 非 INF 


图 14-19 ”1NF 的 一 个 例子 


如 果 有 些 属性 只 依赖 于 复合 关键 字 的 一 部 分 ， 那 这 个 关系 就 不 是 第 二 范式 的 。 作 为 一 个 
简单 的 例子 ， 假 设 我 们 有 一 个 关系 ， 有 4 个 属性 ( Student ID ，Course No，Student Grade， 
Student Name)， 其 中 前 两 个 组 成 一 个 复合 关键 字 。 学 生 的 成 绩 是 依赖 于 整个 关键 字 的 ， 但 姓 
名 只 依赖 于 关键 字 的 一 部 分 。 我 们 可 以 应 用 2NF 过 程 ， 把 关系 分 成 都 是 第 二 范式 的 两 部 分 。 

一 个 不 是 第 二 范式 的 关系 也 可 能 遇 到 问题 。 例 如 ， 在 图 14-20 中 ， 如 果 学 生 连 一 门 课 
的 成 绩 都 没有 ， 那 就 不 能 加 到 数据 库 中 。 但 如 果 我 们 有 两 个 关系 ， 学 生 可 以 加 到 第 二 个 关 
系 中 ， 当 学 生 修 了 一 门 课 ， 完 成 ， 得 到 成 绩 时 ， 关 于 这 个 学 生 的 信息 就 可 以 加 到 第 一 个 关 


系 中 。 





Student ID Student Name 


2NF 


Student ID Course No Grade 





图 14-20 2NF 的 一 个 例子 


3. 其 他 范式 
其 他 范式 使 用 属性 间 更 复杂 的 依赖 关系 。 我 们 把 这 些 依赖 留 给 专门 介绍 数据 库 的 书籍 。 


14.6 ”其 他 数据 库 模 型 
关系 数据 库 并 不 是 当今 唯一 通用 的 数据 库 模型 。 另 两 种 通用 模型 是 ， 分 布 式 数 据 库 和 面 
向 对 象 数据 库 。 我 们 这 里 只 简要 地 介绍 这 两 种 模型 。 


14.6.1 分 布 式 数据 库 


分 布 式 数 据 库 模型 实际 上 并 不 是 一 个 新 的 模型 ， 它 是 基于 关系 模型 的 。 只 不 过 ， 数 据 库 
中 的 数据 存储 在 一 些 通过 因特网 (或 一 些 私有 的 广域网 ) 通信 的 计算 机 上 。 每 台 计算 机 (或 
者 站 点 ) 拥有 部 分 或 全 部 数据 库 。 换 句 话说 ， 数 据 或 者 是 分 别 存储 在 每 个 站 点 上 或 者 是 为 每 


个 站 点 所 复制 。 
1. 不 完全 的 分 布 式 数据 库 
在 不 完全 的 分 布 式 数据 库 中 ， 数据 是 本 地 化 的 。 本 地 使 用 的 数据 存储 在 相应 的 站 点 上 。 
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但 是 ， 这 并 不 意味 着 一 个 站 点 不 能 访问 存储 在 其 他 站 点 的 数据 。 访 问 大 部 分 情况 下 是 本 地 
的 ， 但 偶尔 又 是 全 局 的 。 虽 然 站 点 对 存储 的 本 地 数据 具有 完全 控制 权 ， 但 是 通过 因特网 或 广 
域 网 ， 还 存在 一 个 全 局 的 控制 。 

例如 ， 一 家 医药 公司 在 许多 城市 拥有 多 个 站 点 ， 每 个 站 点 都 有 一 个 数据 库 ， 存 储 着 自己 
的 雇员 信息 ， 但 是 中 心 人 事 部 门 能 控制 所 有 的 数据 库 。 

2. 复制 式 的 分 布 式 数据 库 

在 复制 式 的 分 布 式 数 据 库 中 ， 每 个 站 点 都 有 其 他 站 点 的 一 个 完全 副本 。 对 一 个 站 点 数据 
的 修改 将 会 在 其 他 站 点 的 副本 数据 上 重复 。 这 样 ， 数 据 库 的 安全 性 就 得 到 了 加 强 。 如 果 系 统 
的 一 个 站 点 出 了 问题 ,用户 可 访问 其 他 站 点 的 数据 。 


14.6.2 面向 对 象 数据 库 


关系 数据 库 具 有 数据 的 特定 视图 ， 该 视图 基于 该 关系 数据 库 的 本 质 (元 组 和 属性 )。 关 系 
数据 库 中 最 小 的 数据 集合 就 是 一 个 元 组 与 一 个 属性 列 的 交集 。 但 今天 ， 很 多 应 用 程序 要 求 以 
另 一 种 形式 看 竺 数据。 有些 应 用 程序 则 把 数据 看 成 结构 ( 见 第 11 章 )， 例 如 由 域 构成 的 记录 。 

面向 对 象 数据 库 在 试图 保留 关系 模型 优点 的 同时 允许 应 用 存 取 结 构 化 数据 。 在 面向 对 象 
数据 库 中 ， 定 义 了 对 象 和 它们 的 关系 。 另 外 ， 每 一 个 对 象 可 以 具有 属性 并 以 域 的 形式 表达 。 

例如 在 某 个 组 织 中 ， 可 以 定义 对 象 类 型 ， 如 和 雇员、 部门 和 客户 。 雇 员 类 可 以 定义 一 个 雇 
员 对 象 的 属性 (名 、 姓 、 社 会 保险 号 、 薪 水 等 ) 以 及 如 何 存 取 它 们 。 部 门 对 象 可 以 定义 部 门 
的 属性 以 及 如 何 存 取 它 们 。 另 外 ， 数 据 库 还 可 以 建立 雇员 与 部 门 间 的 关系 (一 个 雇员 在 一 个 
部 门 工作 )。 

XML 

通常 用 作 面 向 对 象 数据 的 查询 语言 是 XML ( Extensible Markup Language)。 起 初 XML 
是 用 来 给 文本 文档 增加 标记 信息 的 ， 但 它 还 应 用 于 数据 库 查 询 语 言 。XML 能 用 其 套 结构 表 


示 数 据 。 
14.7 章 末 材料 
推荐 读物 


有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
e。 Alagic, S. Relational Database Technology, New York: Springer, 1986 
® Dietrich, S$, Understanding Relational Database Query Language, Upper Saddle River, 


NJ: Prentice-Hall, 2001 
。 Elmasri, R. and Navathe, S. Fundamentals of Database Systems, Reading, MA: Addison- 


Wesley, 2006 
se。 Mannino, M. Database Application Development and Design, New York: McGraw-Hill, 


2001 
s Ramakrishnan, R. and Gehrke, J. Database Management Systems, New York: McGraw- 


Hill, 2003 
® Silberschatz, A., Korth, H. and Sudarshan, S$. Databases: System Concepts, New York: 


McGraw-Hill, 2005 
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关键 术语 


application programs (应 用 程序 ) 

attribute (属性 ) 

binary operation (二 元 操作 ) 

cardinality (基数 ) 

conceptual level (概念 层 ) 

database (数据 库 ) 

database management system (DBMS， 数 据 
库 管 理 系 统 ) 

database model (数据 库 模型 ) 

delete operation (删除 操作 ) 

difference operation( 差 操作 ) 

distributed database (分 布 式 数据 库 ) 

End users (终端 用 户 ) 

Entity-Relation Model (E-R， 实 体 关 系 模型 ) 

Entity-Relation(E-R) diagram( 实 体 关 系 图 ) 

external level (外 层 ) 

flat-files (平面 文件 ) 

fragmented distributed database (不 完全 的 分 
布 式 数据 库 ) 

hierarchical model (层次 模型 ) 

insert operation (插入 操作 ) 

internal level (内 层 ) 

International Organization for Standardiz- 


小 结 


ation (ISO ， 国 际 标准 化 组 织 ) 

intersection operation( 交 操作 ) 

join operation (并 操作 ) 

name (姓名 ) 

network model (网 络 模型 ) 

normal form (NF， 范 式 ) 

normalization (规范 化 ) 

object-oriented database (面向 对 象 数据 库 ) 

project operation (投影 操作 ) 

relation (关系 ) 

relational database management system (RDB- 
MS， 关 系数 据 库 管理 系统 ) 

relational model (关系 模型 ) 

replicated distributed database (复制 式 的 分 布 
式 数 据 库 ) 

select operation (选择 操作 ) 

Structured Query Language ( SQL， 结构 化 查 
询 语 言 ) 

tuple (元 组 ) 

unary operation (一 元 操作 ) 

union 〈( 并 操作 ) 

update operation (更 新 操作 ) 

users (用 户 ) 


。 数据 库 是 逻辑 上 相关 的 数据 集合 ， 而 不 必 是 物理 上 的 ， 它 的 各 个 部 分 在 物理 上 可 以 是 
分 开 的 。 数 据 库 管理 系统 定义 、 创 建 和 维护 数据 库 。 

。 美国 国家 标准 协会 /标准 计划 和 需求 委员 会 建立 了 DBMS 的 三 层 体系 结构 : 内 层 、 概 
念 层 和 外 层 。 内 层 决定 了 数据 在 存储 设备 上 的 实际 存储 位 置 概念 层 定义 了 数据 的 逻 


辑 视图 ; 外 层 直接 与 用 户 交互 。 


。 传统 的 三 种 数据 模型 是 : 层次 模型 、 网 状 模型 和 关系 模型 。 只 有 最 后 一 种 关系 模型 仍 


在 使 用 D 


。 在 关系 模型 中 ， 数 据 在 一 张 称 为 关系 的 二 维 表 中 组 织 起 来 。 关 系 有 如 下 特性 : 姓名 、 


属性 和 元 组 。 


。 在 一 个 关系 数据 库 中 ， 我 们 能 定义 几 个 操作 ， 根 据 现 有 的 关系 建立 新 的 关系 。 在 结构 
化 查询 语言 SQL 的 上 下 文中 ， 我 们 提 到 了 9 种 操作 : 插 信 人、 删除、 更新、 选择 、 投 


影 、 连 接 、 并 、 交 和 差 。 


。 数据 库 的 设计 是 一 个 元 长 且 只 能 通过 一 步 步 过 程 来 完成 的 任务 。 第 一 步 通常 涉及 与 数 
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据 库 潜在 用 户 的 面谈 ， 收 集 需要 存储 的 信息 和 每 个 部 门 的 存 取 需 求 。 第 二 步 就 是 建立 
一 个 实体 关系 模型 ， 这 种 模型 定义 了 一 些 信 息 需 要 维护 的 实体 。 下 一 步 就 是 建立 基于 
ERM 的 关系 。 

。 规 范 化 是 一 个 处 理 过 程 ， 通 过 此 过 程 给 定 的 一 组 关系 转化 成 一 组 具有 更 坚固 结构 的 新 
关系 。 规 范 化 要 人 允许 数据 库 中 表示 的 任何 关系 ， 要 允许 像 SQL 这 样 的 语言 去 使 用 由 
原子 操作 组 成 的 恢复 操作 ， 要 移 除 插 入 、 删 除 和 更 新 操作 中 的 不 规则 ， 要 减少 当 新 的 
数据 类 型 被 加 入 时 对 数据 库 重建 的 需要 。 

。 关 系数 据 库 不 是 当今 唯一 的 数据 模型 ， 两 个 其 他 常见 模型 是 分 布 式 数据 库 和 面向 对 象 


数据 库 。 
14.8 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q14-1 数据 库 管理 系统 的 5 个 必要 的 组 成 部 分 是 什么 ? 

Q14-2 ”数据库 有 哪 三 种 数据 库 模 型 ? 哪 种 是 目前 流行 的 ? 

Q14-3 ”什么 叫 关系 数据 库 中 的 关系 ? 

Q14-4 在 一 个 关系 中 ， 什 么 称 为 属性 ? 什么 称 为 元 组 ? 

Q14-5 列 出 关系 数据 库 中 的 一 些 一 元 操作 。 

Q14-6 列 出 关系 数据 库 中 的 一 些 二 元 操作 。 

Q14-7 什么 是 SQL? 什么 是 XML ? 哪 一 个 是 关系 数据 库 的 查询 语言 ? 哪 一 个 是 面向 对 象 数据 库 的 查 
询 语言 ? 


练习 题 
图 14-21 应 用 于 练习 题 P14-1 一 P14-5。 


A 
TT 
2 [161102 
| 
4 1191104. 





16 
19 
图 14-21 P14-1 一 P14-5 中 的 关系 

| 
P14-1 有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 列 SQL 语句 的 结果 。 


select * 
from A 
where A2=16 


P14-2 有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 列 SQL 语句 的 结果 。 


select Al A2 
from A 
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P14-3 


P14-4 


P14-5 


P14-6 


P14-7 
P14-8 

P14-9 

P14-10 
P14-11 
P14-12 
P14-13 
P14-14 
P14-15 


P14-16 
P14-17 
P14-18 
P14-19 


P14-20 
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Where A2=16 
有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 列 SQL 语句 的 结果 。 


Select 及 3 
from A 


有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 列 SQL 语句 的 结果 。 


select Bl1 
from B 
where B2=216 


有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 列 SQL 语句 的 结果 。 


update C 
set Cl=37 
where Cl=31 


用 14.3.3 节 中 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 含有 课程 号 和 每 门 课程 单元 的 数目 
的 关系 。 
用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 含有 学 生 ID 和 姓名 的 关系 。 
用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 含 有 教授 姓名 的 关系 。 
用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 含 有 系 名 称 的 关系 。 
用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 ID=2010 的 学 生 所 上 课程 的 关系 。 
用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 Blake 教授 所 教 课程 的 关系 。 
用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 包含 UNITS=3 的 课程 的 关系 。 
用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 包含 选 学 了 课程 CIS015 的 学 生 姓 名 的 关系 。 
用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 包含 计算 机 科学 系 的 系 号 的 关系 。 
下 面 的 关系 是 属于 第 一 范式 ( INEF) 吗 ? 如 果 不 是 ， 修 改 该 表 使 它 符 合 1NF 的 标准 。 


| | oo | 


为 一 公共 图 书馆 创建 BE-R 图 ， 并 显示 能 从 这 个 图 中 创建 的 关系 略图 。 
为 一 房地产 公司 创建 E-R 图 ， 并 显示 能 从 这 个 图 中 创建 的 关系 略图 。 
为 一 家 航空 公司 的 三 个 实体 FLIGHT、AIRCRAFT 和 PILOT 建立 一 个 E-R 图 ， 并 显示 这 个 


公司 的 关系 略图 。 
使 用 参考 资料 或 因特网 查找 关于 第 三 范式 (3NF) 的 资料 ， 在 这 种 范式 中 涉及 了 哪 种 函数 


依赖 ? 
使 用 参考 资料 或 因特网 查找 关于 Boyce-Codd 范式 ( BCNF) 的 资料 ， 在 这 种 范式 中 涉及 了 哪 


种 函数 依赖 ? 
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数据 压缩 


近来 ， 技 术 改 变 了 我 们 传输 和 存储 数据 的 方式 。 例 如 ， 光 纤 电费 使 我 们 能 更 加 快速 地 传 
输 数 据 ，DVD 技术 使 得 在 较 小 物理 媒介 上 存储 大 量 的 数据 成 为 可 能 。 然 而 ， 如 同 生 活 的 其 
他 方面 一 样 ， 人 们 的 要 求 也 正 逐 渐 增 加 。 今 天， 人 们 希望 在 更 短 的 时 间 内 下 载 更 多 的 数据 。 
同样 ， 人 们 也 希望 能 在 更 小 的 空间 存储 更 多 的 数据 。 | 

压缩 数据 通过 部 分 消除 数据 中 内 在 的 元 余 来 减少 发 送 或 存储 的 数据 量 。 当 我 们 产生 数据 
的 同时 ， 宛 余 也 就 产生 了 。 通 过 数据 压缩 ， 提 高 了 数据 传输 和 存储 的 效率 ， 同 时 保护 了 数据 
的 完整 性 。 

目标 | 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 区 分 无 损 压 缩 和 有 损 压 缩 ; 

。 描述 游程 长 度 编码 和 它 是 如 何 实现 压缩 的 ; 

。 描述 赫 夫 曼 编码 和 它 是 如 何 实现 压缩 的 ; 

。 描述 Lempel Ziv 编码 以 及 字典 在 编码 和 译 码 中 的 作用 ; 

。 描述 压缩 静止 图 像 的 了 PEG 标准 背后 的 主要 思想 ; 

。 描述 压缩 视频 的 MPEG 标准 背后 的 主要 思想 以 及 它 与 JPEG 间 的 关系 ; 

。 描述 压缩 音频 的 MP3 标准 背后 的 主要 思想 。 


15.1 引言 


数据 压缩 意味 着 发 送 或 是 存储 更 少 的 位 数 。 虽 然 有 很 多 方法 用 于 此 目的 ， 但 这 些 方法 一 
般 可 分 为 两 类 : 无损 压缩 和 有 损 压 缩 。 图 15-1 给 出 了 这 两 类 以 及 每 类 中 常用 的 一 些 方法 。 





EE 
bn 数据 压缩 方法 
我 们 首先 讨论 比较 简单 和 容易 理解 的 无 损 压 缩 ， 再 介绍 复杂 些 的 有 损 压缩 。 
15.2 无 损 压 缩 方法 
在 无 损 数据 压缩 中 ， 数 据 的 完整 性 是 受到 保护 的 。 原 始 数 据 与 压缩 和 解压 后 的 数据 完全 


一 样 。 因 为 在 这 种 压缩 方法 中 ， 压 缩 和 解压 算法 是 完全 互 反 的 两 个 过 程 ， 在 处 理 过 程 中 没有 
数据 丢失 。 元 余 的 数据 在 压缩 时 被 移 走 ， 在 解压 时 再 被 加 回去 。 
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通常 这 种 方法 在 不 想 丢 失 数据 时 使 用 。 例 如 ， 当 压缩 文档 资料 或 应 用 程序 时 ， 我 们 当然 


不 希望 丢失 其 中 的 数据 。 
本 节 中 我 们 将 讨论 三 种 无 损 压 缩 方 法 ， 分别 为 : 游程 长 度 编码 、 赫 夫 受 编码 、Lempel 


Ziv 算法 。 
15.2.1 游程 长 度 编码 


游程 长 度 编码 也 许 是 最 简单 的 压缩 方法 ， 可 以 用 来 压缩 由 任何 符号 组 成 的 数据 。 它 不 需 
要 知道 字符 出 现 频率 的 有 关 知 识 ( 赫 夫 曼 编码 则 和 需要 )， 并 且 当 数据 中 由 0 和 1 表示 时 十 分 


有 效 。 
这 种 算法 的 大 致 思想 是 将 数据 中 连续 重复 出 现 的 符号 用 一 个 字符 和 这 个 字符 重复 的 次 数 


来 代替 。 例 如 ，AAAAAAAA 可 以 用 A08 来 代替 。 图 15-2 显示 了 这 种 简单 压缩 方法 的 一 个 
示例 。 注 意 ， 我 们 使 用 固定 位 数 (2 位 ) 的 数字 来 表示 数 。 


BBBBBBBBBAAAAAAAAAAAAAAAANMMMMMMMMMM 
一 一 
B09A16N0OIM10 


b) 压缩 过 的 数据 
图 15-2 游程 长 度 编 码 的 例子 


在 位 模式 中 ， 如 果 数 据 只 用 两 种 符号 (0 和 1 )， 并 且 一 种 符号 比 另 一 种 符号 使 用 更 为 频 
驼 ， 那 么 这 种 压缩 方法 就 更 有 效 。 例 如 ， 假 设 一 段 数据 里 面 有 很 多 的 0 而 1 很 少 , 那么， 就 
可 以 通过 在 发 送 (或 存储 ) 时 只 标记 在 两 个 1 中 间 有 多 少 个 0 来 减少 数据 的 位 数 (图 15-3 )。 


a) 原始 数据 


a) 原始 数据 





000000000000001000011000000000000 





1110 0100 0000 1100 
b) 压缩 过 的 数据 
图 1$-3 ”两 个 字符 的 游程 长 度 编码 





这 里 我 们 用 4 位 二 进 制 数 (无 符号 整数 ) 计数 。 实 际 中 ， 为 避免 引入 额外 宛 余 ， 我 们 
应 该 寻找 一 个 最 佳 的 位 数 来 计数 。 在 图 15-3 中 ， 第 一 个 1 之 前 有 14 个 0, 这 14 个 0 被 压 
缩 成 二 进 制 模式 1110 (二 进 制 中 表示 14 )。 接 下 来 的 一 组 连续 的 0 被 压缩 成 0100， 因 为 有 
4 个 0。 后 面 又 接着 的 两 个 连续 的 1， 压缩 时 用 0000 替代 。 最 后 数据 中 的 12 个 0 被 压缩 成 
1100。 

注意 ,用 4 位 二 进 制 压缩 时 ， 如 果 连 续 的 0 多 于 15 个 ， 它 们 将 被 分 为 2 组 或 者 更 多 的 
组 。 例如， 连续 的 25 个 0 编码 为 1111 1010。 现 在 的 问题 则 是 : 接收 者 如 何 知道 这 是 25 个 
0 而 不 是 连续 15 个 0 后 接着 1 个 1， 然后 再 接 10 个 0? 答案 是 ， 如 果 第 一 个 计数 是 1111， 
我 们 就 默认 下 一 个 4 位 模式 仍然 是 用 于 表示 连续 0 的 数目 。 而 男 一 个 问题 又 产生 了 : 假如 2 


慌 拘 压 纵 275 


个 1 工 之 间 刚 好 15 个 0 时 又 怎么 办 呢 ? 这 种 情况 下 的 模式 是 1111 后 再 紧 跟 0000。 


15.2.2 ” 赫 夫 曼 编 码 


在 赫 夫 曼 编 码 中 ， 对 于 出 现 更 为 频繁 的 字符 分 配 较 短 的 编码 ， 而 对 于 出 现 较 少 的 字符 分 
配 较 长 的 编码 。 例 如 ， 假 使 有 一 篇 文本 文件 只 用 到 了 5 个 字符 (A，B，C，D，E)。 这 里 为 
了 讨论 的 方便 只 选 5 个 字符 ， 但 该 程序 对 于 字符 数目 的 多 少 都 同样 有 效 。 

在 给 每 个 字符 分 配 位 模式 前 ， 首 先 根据 每 个 字符 的 使 用 频率 给 它们 分 配 相应 的 权 值 。 在 
这 个 例子 中 ， 假 定 字符 出 现 的 频率 如 表 15.1 所 示 。 字 符 A 出 现 的 频率 为 17%， 字 符 B 出 现 
的 频率 为 12%， 等 等 。 


表 15-1 字符 的 出 现 频率 


me | "| » | » | m | 


一 旦 建立 了 各 个 字符 的 权 值 后 ， 就 可 以 根据 这 些 值 构造 一 棵 树 。 构 造 树 的 过 程 如 
图 15-4 所 示 。 它 遵循 以 下 三 个 基本 步骤 : 

1 ) 将 全 部 字符 排 成 一 排 。 每 个 字符 现在 都 是 树 的 最 底层 节点 。 

2 ) 找 出 权 值 最 小 的 两 个 节点 并 由 它们 合成 第 三 个 节点 ， 产 生 一 棵 简单 的 二 层 树 。 新 节 
点 的 权 值 由 最 初 的 两 个 节点 的 权 值 结 合 而 成 。 这 个 节点 ， 在 叶子 节点 的 上 一 层 ， 可 以 再 与 其 
他 的 节点 结合 。 请 记 住 ， 选 择 所 结合 的 两 个 节点 的 权 值 和 必须 比 其 他 所 有 可 能 的 选择 小 。 

3 ) 重复 步 又 2 )， 直 到 各 个 层 上 的 所 有 节点 结合 成 为 一 棵 树 。 


41 
24 
OOOOO00 oggocoog@ /oo 
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a) b) c) 





15-4 ” 赫 夫 曼 编码 


树 的 构造 完成 后 ， 利 用 它 来 给 各 个 字符 分 配 编码 。 首 先 ， 给 每 个 分 支 分 配 1 位 。 从 根 
(顶部 节点 ) 开始 ， 给 左 分 支 分 配 0， 给 右 分 支 分 配 1， 然 后 在 其 他 各 个 节点 重复 这 一 模式 。 

一 个 字符 的 编码 是 这 样 得 到 的 ， 首 先 从 根 开始 ， 沿 着 分 支 到 达 字符 所 在 的 位 置 。 该 字符 
的 编码 就 是 所 经 过 的 路 径 上 各 分 支 位 值 的 顺序 排列 。 图 15-5 给 出 了 最 终 的 生成 树 和 相对 应 
的 编码 。 注 意 我 们 移动 了 叶子 节点 以 使 整 棵 树 更 像 一 棵 二 叉 树 。 

注意 以 下 编码 的 要 点 。 首 先 ， 出 现 频 率 高 的 字符 (A、D 和 E) 的 编码 要 比 出 现 频 率 低 
的 字符 (B 和 C) 的 编码 短 。 这 点 可 以 通过 比较 分 配给 各 个 字符 的 编码 适当 的 位 长 度 看 出 。 
其 次 ， 在 这 个 编码 系统 中 ， 没 有 一 个 编码 是 其 他 编码 的 前 级 。 图 中 2 位 编码 00、10 或 者 
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11， 都 不 是 其 他 两 种 编码 ( 010，011 ) 中 任何 一 个 的 前 级 。 换 句 话 说 ， 不 存在 一 个 3 位 编码 
是 以 00、10 或 11 开头 的 ， 这 个 特性 使 得 赫 夫 曼 编 码 是 一 种 即时 的 编码 。 我 们 将 会 在 讨论 赫 


夫 曼 编码 的 编码 和 译 码 时 解释 这 个 问题 。 
1. 编码 
让 我 们 看 看 怎样 用 这 5 个 字符 的 编码 压缩 文档 。 如 图 15-6 所 示 是 编码 前 后 的 文本 。 
文本 













A 一 00 了 一 ”10 
B 一 0190 BE 一， 了 
C —» 01l 





A: 00 D: 10 编码 器 





赫 夫 曼 码 
图 15-5 最 终 树 和 相对 应 的 编码 图 15-6 赫 夫 曼 编 码 


这 里 有 两 点 值得 注意 。 首 先 注意 到 ， 即 使 是 这 样 小 的 不 切实 际 的 编码 压缩 也 有 其 意义 。 
如 果 想 在 不 压缩 成 赫 夫 曼 编码 的 情况 下 就 发 送 这 个 文本 ， 那 么 需要 给 每 个 字符 一 个 3 位 编 
码 ， 总 共 需 传送 30 位 ， 而 用 赫 夫 曼 编码 则 只 发 送 22 位 。 

其 次 ,我 们 没有 在 每 个 字符 的 编码 中 间 加 上 分 隔 符 。 我 们 只 是 一 个 接 一 个 地 写 代码 。 赫 
夫 曼 编码 的 好 处 就 是 没有 一 个 编码 是 其 他 编码 的 前 级 ， 这 样 在 编码 过 程 中 没有 二 义 性 ， 接 收 
方 接收 到 数据 解压 缩 时 也 不 会 产生 二 义 性 。 

2. 详 码 

接收 方 译 码 十 分 容易 。 图 15-7 给 出 了 译 码 的 过 程 。 当 
接收 方 收 到 前 2 位 数 的 时 候 ， 它 不 必 等 收 到 下 一 个 位 就 可 i 
以 译 码 。 它 知道 应 该 译 码 为 E。 其 原因 是 ， 这 两 位 不 是 任 es 
何 3 位 码 前 绥 (没有 11 开头 的 3 位 码 )。 同 样 ， 当 接收 方 收 
到 下 两 位 时 ( 00 ) 时 ， 它 也 知道 应 该 翻译 为 A。 再 下 两 位 
以 同样 的 方式 翻译 ( 11 一 定 是 E)。 然 而 ， 当 收 到 第 7 和 第 | 1 一 E 
8 位 时 ， 计 算 机 知道 需要 等 下 一 位 ， 因 为 编码 01 不 在 编码 
表 里 。 当 收 到 下 一 位 (0) 时 ， 它 将 这 3 位 连 在 一 起 (010 ) 
翻译 为 B。 这 就 是 赫 夫 曼 编码 称 为 即时 码 的 原因 。 译 码 器 可 文本 
以 即时 明确 地 翻译 出 编码 (在 最 小 位 数 下 )。 图 15-7 蔡 夫 曼 译 码 











15.2.3 Lempel Ziv 编码 


Lempel Ziv ( LZ) 编码 是 称 为 基于 字典 的 编码 的 那 一 类 算法 的 一 个 例子 它 是 用 其 发 明 者 
的 名 字 ( Abraham Lempel 和 Jacob Ziv) 命名 的 。 在 通信 和 会话 的 时 候 它 将 产生 一 个 字符 串 字 
典 (一 个 表 )。 如 果 接 收 和 发 送 双方 都 有 这 样 的 字典 ， 那 么 字符 串 可 以 由 字典 中 的 索引 代替 ， 
以 减少 通信 的 数据 传输 量 。 

尽管 方案 看 似 简单 ， 但 执行 起 来 仍然 有 些 困难 。 首 先 ， 怎 样 为 每 一 次 通信 会 话 产生 一 个 
字典 (由 于 字符 串 的 长 度 不 定 ， 很 难 找 到 通用 的 字典 ) ? 其 次 ， 接 收 方 怎样 获得 发 送 方 的 字 


发 据 压 绾 2 


典 (如 果 同 时 发 送 字 典 ， 就 增加 了 额外 的 数据 ,这样 ， 与 我 们 压缩 的 目的 是 相悖 的 ) ? 

一 个 实用 的 算法 是 Lempel Ziv (LZ) 算法 ， 该 算法 是 基于 字典 的 自 适应 编码 的 思想 。 这 
种 算法 有 不 同 的 版 本 (LZ77、LZ78 等 )。 我 们 以 一 个 实例 来 介绍 这 个 算法 的 基本 思想 ， 但 不 
涉及 不 同 版 本 和 实现 的 具体 细节 。 在 例子 中 ， 假 设 要 发 送 的 字符 串 如 下 所 示 ， 选 择 这 个 特殊 
的 字符 串 是 为 了 讨论 方便 。 

BAARBABBRBAABBBBAA 

使 用 LZ 算法 的 简单 版 本 ， 整 个 过 程 分 为 两 个 阶段 ， 压 缩 字 符 串 和 解压 字符 串 。 

1. 压缩 

这 个 阶段 ， 需 要 同时 做 有 两 件 事 : 建立 字典 索引 和 压缩 字符 串 。 算 法 从 未 压缩 的 字符 
串 中 选取 最 小 的 子 字 符 串 ， 这 些 子 字符 串 在 字典 中 不 存在 。 然 后 将 这 个 子 字符 串 复 制 到 字典 
(作为 一 个 新 的 记录 ) 并 为 它 分 配 一 个 索引 值 。 压 缩 时 ， 除 了 最 后 一 个 字母 之 外 ， 其 他 所 有 
字符 被 字典 中 的 索引 代替 。 然 后 将 索引 和 最 后 一 个 字母 搬入 压缩 字符 串 。 比 如 ABBB ， 在 字 
典 中 找到 ABB 和 它 的 索引 4， 得 到 的 压缩 字符 串 就 是 4B。 图 15-8 显示 了 这 个 过 程 。 


未 压缩 的 BAABABBBAABBBBAA 


解析 字符 囊 
lB 


革 此 乱 解析 字符 串 


BA 


Sa tre 


B.A, 2B 一 散光 一 ABABBBAABBBBAA 


1 AAB {ABE 解析 字符 


B, A. 2B. 3B NT (ABBBAABBBBAA 
| = 
一 | A a AB [| 总] 解析 字符 串 

BA 2B.3B- 1A 一 胰 开 -一 BAABBBBAA 


解析 字符 串 
< 一 ABBBBAA 





B, A 2B, 3B, 1A, 4B, 5A 


图 15-8 Lempel Ziv 编码 的 例子 


让 我 们 看 看 这 里 的 几 个 步骤 : 
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第 一 步 

压缩 过 程 从 原始 字符 串 中 选择 不 在 字典 中 的 最 小 子 字符 串 。 因 字典 是 空 的 ， 最 小 字符 串 
是 单字 符 (第 一 个 字符 是 B)。 于 是 将 它 作为 第 一 条 记录 加 入 字典 并 赋予 索引 值 1。 这 个 子 字 
符 串 不 存在 子 串 可 以 被 字典 中 的 索引 取代 的 情况 (因为 它 只 有 一 个 字符 )。 压 缩 过 程 将 B 插 
入 压缩 字符 串 。 至 此 ， 压 缩 字符 串 仅 有 一 个 字符 B， 而 未 压缩 的 字符 串 则 由 原始 的 字符 串 中 
减 去 了 第 一 个 字符 。 

第 二 步 

压缩 过 程 选择 下 一 个 不 在 字典 中 的 最 小 子 字符 串 。 这 里 是 A， 压 缩 过 程 将 A 作为 第 二 
条 记录 加 入 字典 。 这 个 子 字 符 串 也 不 存在 子 串 可 以 被 字典 中 的 索引 取代 〈 它 仅 有 一 个 字母 )。 
压缩 过 程 将 A 加 入 压缩 字符 串 。 至 此 ， 压 缩 字 符 串 里 就 有 了 两 个 字母 B 和 A (在 压缩 字符 
串 中 ， 相 邻 的 子 字符 串 之 间 加 逗号 以 示 隔 开 )。 

第 三 步 

压缩 过 程 继续 选择 下 一 个 不 在 字典 中 的 最 小 子 字 符 串 。 此 时 的 情况 与 前 两 步 不 同 ， 下 一 
个 字符 (A) 已 经 在 字典 中 了 ， 因 此 此 时 选择 的 字符 串 为 AB。 它 在 字典 中 并 不 存在 ， 于 是 将 
AB 作为 第 三 条 记录 加 入 字典 。 压 缩 过 程 发 现 字 典 里 存在 这 个 字符 串 除去 最 后 一 个 字符 的 子 
串 ( AB 除去 最 后 一 个 字符 为 A)， 而 A 在 字典 中 的 索引 号 为 2， 所 以 压缩 过 程 用 2 代替 A 并 
将 2B 加 入 压缩 字符 串 中 。 


第 四 步 
接着 ， 压 缩 过 程 选 择 了 ABB (因为 字典 中 已 经 存在 A、AB)， 并 将 ABB 作为 第 四 条 记 


录 加 入 字典、 赋予 索引 值 4。 压 缩 过 程 这 时 发 现 字 典 里 存在 该 子 串 除去 最 后 一 个 字符 的 子 串 
(AB)， 其 索引 值 为 3。 于 是 3B 加 入 压缩 字符 串 中 。 

细心 的 读者 也 许 已 经 注意 到 ， 在 前 面 的 三 步 中 ， 我 们 实际 上 并 未 实现 任何 压缩 。 因 为 一 
个 字符 的 码 被 一 个 所 代替 (第 一 步 中 A 被 A 代 替 ， 第 二 步 中 B 被 B 代替 )， 两 个 字符 被 两 个 
字符 所 代替 (第 三 步 中 AB 被 2B 代替 )。 但 是 在 这 一 步 当 中 我 们 确实 减少 了 字数 (ABB 变 成 
了 3B)， 如 果 原 始 的 字符 串 出 现 了 许多 这 样 的 重复 字符 串 ，( 在 大 多 数 情况 下 该 情况 确实 存 
在 )， 那 么 我 们 便 可 以 大 大 地 减少 字符 的 数量 。 

剩 下 的 几 步 与 前 述 的 四 步 相似 。 需 要 注意 的 是 ， 这 里 字典 仅仅 为 发 送 方 用 来 寻找 索引 ， 
而 并 没有 传送 到 接收 方 。 实 际 上 正如 下 一 节 所 述 ， 接 收 方 必须 自己 来 创建 字典 。 

2. 解压 . 

解压 是 压缩 的 逆 过 程 。 该 过 程 从 压缩 的 字符 串 中 取出 子 字 符 早 ， 然 后 尝试 按照 字典 中 所 
列 出 的 记录 还 原 相 应 的 索引 号 为 对 应 的 字符 串 。 字 典 开 始 为 空 ， 之 后 会 逐渐 地 建立 起 来 。 该 
过 程 的 总 体 思 路 是 当 一 个 索引 号 被 接收 时 ， 在 字典 中 已 经 存在 了 与 其 相应 的 记录 。 图 15-9 
给 出 了 解压 的 过 程 。 

让 我 们 来 看 看 如 何 完成 图 中 所 示 各 步骤 ; 

第 一 步 

检验 第 一 个 被 压缩 的 子 字符 串 ， 它 是 没有 索引 号 的 字符 B。 因 为 子 字 符 串 不 在 字典 中 ， 
因此 将 其 添加 到 字典 中 。 这 样子 字符 串 B 被 插入 解压 的 字符 串 中 。 

第 二 步 

检验 第 二 个 被 压缩 的 子 字符 串 (A)， 情 况 与 上 一 步 类 似 。 这 样 解压 的 字符 串 中 就 有 了 两 
个 字符 (B、A)。 字 上 典 中 此 时 也 有 了 两 条 记录 。 
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图 15-9 Lempel Ziv 译 码 的 例子 





第 三 步 

检验 第 三 个 被 压缩 的 于 字符 下 (2B)， 查 找 字典 ， 用 子 字符 串 A 代替 索引 号 2。 于 是 子 
字符 串 (AB) 就 被 加 到 解压 的 字符 串 中 ， 并 将 AB 添加 到 字典 中 。 

第 四 步 

检验 第 四 个 被 压缩 的 子 字 符 串 (3B)， 查 找 字 典 ， 用 子 字符 串 AB 代替 索引 号 3。 于 是 
子 字 符 串 ABB 就 被 添加 到 解压 的 字符 串 中 ， 并 将 ABB 添加 到 字典 中 。 

剩 下 的 三 步 留 给 读者 作为 练习 。 当 然 我 们 注意 到 ， 这 里 用 1 或 2 等 数字 作为 索引 号 。 在 
实际 中 ， 为 提高 效率 ， 索 引号 是 位 模式 的 (长 度 是 变化 的 ) 。 同 样 我 们 也 注意 到 ，LZ 编码 没 
有 压缩 最 后 一 个 字符 (这 意味 着 降低 了 压缩 的 效率 )。LZ 编码 的 一 个 版 本 ， 叫 作 Lempel Ziv 
Welch ( LZW ) 编码 ， 则 将 这 最 后 的 一 个 字符 也 压缩 了 。 有 关 此 类 算法 的 讨论 我 们 留 给 其 他 
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15.3 ”有 损 压缩 方法 


信息 的 丢失 无 论 在 文本 文件 还 是 程序 文件 中 都 是 不 能 接受 的 。 但 是 在 图 片 、 视 频 或 音频 
文件 中 是 可 以 接受 的 。 这 是 因为 我 们 的 眼睛 和 耳 条 并 不 能 够 分 辨 出 如 此 细小 的 差别 。 因 此 对 
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于 这 些 情况 ， 可 以 使 用 有 损 数据 压缩 的 方法 。 这 使 得 我 们 在 以 每 秒 传送 数 百 万 位 的 图 像 和 视 
频数 据 时 只 需 花 费 更 少 的 时 间 和 空间 以 及 更 廉价 的 代价 。 

有 关 有 损 压 缩 的 技术 已 经 存在 一 些 成 熟 的 方法 。 联 合 图 像 专家 组 (JPEG) 用 来 压缩 图 片 
和 图 像 ， 运 动 图 像 专家 组 (MPEG) 用 来 压缩 视频 ，MPEG 第 三 代 音 频 压 缩 格 式 (MP3 ) 则 


用 来 压缩 声音 


15.3.1 图 像 压 缩 : JPEG 
正如 第 2 章 讨论 过 的 ， 一 幅 图 像 可 以 通过 一 个 二 维 数组 ( 表 ) 来 表示 图 像 元 素 (像素 )， 
例如 ，640 x 480=307 200 像素 。 如 果 图 像 是 灰 度 的 ， 那 么 像素 可 以 由 一 个 8 位 整数 (256 个 
灰 度 级 别 ) 来 表示 ， 如 果 图 像 是 彩色 的 ， 每 个 像素 可 以 由 24 位 表示 (3 x 8 位 )， 其 中 每 8 位 
表示 RBG 颜色 系统 中 的 一 个 颜色 。 为 了 讨论 的 简单 ， 我 们 假定 图 像 是 灰 度 的 且 有 640 x 480 
像素 。 我 们 可 以 看 到 为 什么 需要 压缩 ， 一 个 有 307 200 像素 的 灰 度 图 像 需 要 用 2 457 600 位 
来 表示 ， 而 彩色 图 片 则 需要 7 372 800 位 来 表示 。 
在 JPEG 中 ， 一 幅 灰 度 图 像 将 被 分 成 许多 
8 x 8 的 像素 块 (图 15-10 )。 将 图 像 划分 成 块 的 目 
的 是 考虑 到 减少 计算 量 。 显 而 易 见 ， 此 时 每 幅 图 
像 的 数学 运算 量 是 单元 数 的 平方 。 也 就 是 说 ， 整 
个 图 像 需 要 307 200” 次 运算 (94 371 840 000 次 
运算 )。 而 如 果 使 用 JPEG， 则 需要 对 每 个 块 进行 有 
642 次 运算 ， 总 共 是 642x80x60， 即 19 660 800 FS 
次 运算 。 这 将 原来 的 运算 量 减 少 到 1/4800。 人 
JPEG 的 整体 思想 是 将 图 像 变 换 成 一 个 数 的 线性 (矢量 ) 集合 来 揭示 元 余 。 这 些 匈 余 ( 缺 
乏 变 化 的 ) 可 以 通过 使 用 前 面 学 过 的 无 损 压 缩 的 方法 来 除去 。 图 15-11 给 出 了 一 个 简单 版 本 
的 处 理 过 程 。 





JPEG 的 三 个 步骤 


压缩 后 的 图 像 





图 15-11 JPEG 处 理 过 程 


1. 离散 余弦 变换 
在 此 步骤 中 ， 每 个 64 像素 块 都 要 用 离散 余弦 变换 ( DCT) 进行 变换 。 这 种 变换 改变 了 


64 个 值 以 使 相 邻 像素 之 间 的 关系 得 以 保持 ， 但 同时 又 能 够 揭示 宛 余 。 在 附录 G 中 给 出 了 相 
应 的 公式 。P(x, y) 定义 了 每 个 块 上 的 值 ; 7T(m, n) 则 定义 了 变换 后 的 块 的 值 。 

为 了 理解 该 变换 的 本 质 ， 让 我 们 研究 以 下 三 种 情况 变换 后 的 结果 。 

情况 1 

在 此 情况 中 ， 图 像 中 每 个 块 都 有 统一 的 灰 度 ， 每 个 像素 的 灰 度 值 是 20。 当 进行 变换 后 ， 
我 们 得 到 第 一 个 像素 (左上 角 ) 的 一 个 非 零 值 。 其 余 像 素 的 结果 为 零 。 这 是 由 于 根据 公式 ， 
7(0, 0) 是 其 他 值 的 平均 值 。 我 们 称 为 DC 值 (直流 ， 借 用 电气 工程 中 的 概念 )。7Tl(m, n) 中 其 
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余 的 值 称 为 AC 值 ， 表 示 像 素 值 的 变化 。 因 为 这 里 没有 变化 ， 所 以 其 他 的 值 为 0 (图 15-12 )。 
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图 15-12 情况 1: 统一 的 灰 度 类 型 
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情况 2 : 

在 第 二 种 情况 中 ， 有 一 个 分 成 两 种 不 同 灰 度 级 区 域 的 块 。 像 素 的 值 有 一 个 明显 的 变化 
(从 20 到 50 )。 当 做 变换 时 ， 得 到 一 个 DC 值 和 非 零 AC 值 。 但 此 时 只 有 很 少 的 非 零 值 簇 绕 
着 DC 值 ， 其 余 绝 大 多 数值 都 是 0 (图 15-13 )。 
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情况 3 
在 第 三 种 情况 中 ， 有 一 个 渐变 灰 度 的 块 。 也 就 是 说 ， 相 邻 像素 值 之 间 没 有 突变 。 当 做 变 
换 时 ， 得 到 一 个 DC 值 和 许多 非 零 AC 值 (图 15-14 )。 
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图 15-14 情况 3; 渐变 灰 度 类 型 


从 图 15-12、 图 15-13 和 图 15-14， 我 们 可 以 叙述 如 下 : 

。 转换 从 书 表 生成 了 表 。 

。 DC 值 是 像素 的 平均 值 。 

。AC 值 显 示 变 化 。 

。 邻近 像素 缺少 变化 的 生成 0。 

应 注意 ，DCT 是 可 逆 的 。 附 录 G 同样 也 给 出 了 逆 变 换 的 数学 公式 。 

2. 量化 有 

生成 了 表 后 ， 这 些 值 将 被 量化 以 减少 需要 编码 的 位 数 。 量 化 过 程 用 一 个 常量 来 除 位 数 ， 
然后 舍弃 小 数 部 分 。 这 样 可 以 更 加 减少 需要 编码 的 位 数 。 在 大 多 数 实现 方法 中 ， 通 过 一 张 量 
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化 表 (8 x 8 ) 定义 了 如 何 量 化 每 个 值 ， 其 中 除数 取决 于 T 表 位 置 上 的 值 。 这 样 做 可 以 对 每 
一 个 特殊 的 应 用 程序 优化 位 数 和 0 的 个 数 。 i 

注意 在 整个 过 程 中 只 有 量化 阶段 是 不 可 道 的。 在 这 里 所 失去 [3 z 
的 一 些 信息 是 不 能 恢复 的 。 事 实 上 ，JPEG 之 所 以 称 为 有 损 压 缩 
就 是 因为 量化 过 程 所 带 来 的 损失 。 

3. 压缩 

量化 后 ， 将 表 中 的 值 读 出 并 去 掉 多 余 的 0。 但 是 ， 为 了 把 0 
聚集 起 来 ， 整 个 压缩 过 程 以 Z 字形 按 对 角 线 读 取 表 ， 而 不 是 按 行 
或 列 。 原 因 是 如 果 图 像 没 有 很 好 的 变化 ，T 表 底部 的 右 下 角 将 全 
为 0。 图 15-15 给 出 了 该 过 程 。JPEG 在 压缩 阶段 通常 使 用 游程 长 
度 编 码 来 压缩 从 Z 字形 线性 化 读 取 的 位 模式 。 


15.3.2 ”视频 压缩 : MPEG 图 15-15 读 取 表 


运动 图 像 专家 组 (MPEG) 方法 用 于 压缩 视频 。 原 则 上 ， 一 个 运动 的 图 像 是 一 系列 快速 
帧 的 序列 。 每 个 帧 都 是 一 幅 图 像 。 换 句 话 说， 帧 是 像素 在 空间 上 的 组 合 ， 视 频 是 一 幅 接 一 幅 
发 送 的 帧 的 时 间 组 合 。 压 缩 视频 ， 就 是 对 每 帧 空间 上 的 压缩 和 对 一 系列 帧 时 间 上 的 压缩。 


空间 压缩 
每 一 帧 的 空间 压缩 使 用 了 PEG (或 它 的 改进 版 )。 每 一 帧 都 是 一 幅 图 ， 可 以 单独 压缩 。 


时 间 压 缩 

在 时 间 压 缩 中 ， 多 余 的 帧 将 被 丢弃 。 当 我 们 看 电视 时 ， 每 秒 接收 30 帧 。 但 是 ， 大 多 数 
连续 的 帧 几乎 是 一 样 的 。 例 如 ， 当 一 个 人 说 话 时 ， 大 部 分 帧 除了 用 于 表示 嘴唇 附近 的 帧 的 片 
段 不 断 变 化 外 ， 与 其 前 面 的 帧 几乎 相同 。 

通过 粗略 的 估算 就 可 以 证 明 视频 时 间 压 缩 的 需要 。 一 个 20:1 的 JPEG 压缩 图 像 每 帧 需 
要 发 送 368 640 位 ; 每 秒 30 由， 则 每 秒 需 要 传送 11 059 200 位 ， 显 然 我 们 需要 减少 该 数量 。 

为 了 压缩 时 间 数 据 ，MPEG 方法 首先 把 帧 分 成 三 类 ; I- 帧 、P- 帧 、B- 帧 。 

。 |- 帧 : 内 部 编码 帧 ， 是 一 个 独立 蚌 ， 该 帧 与 任何 其 他 帧 〈 即 在 其 前 发 送 的 帧 或 者 在 其 
后 发 送 的 帧 ) 无 关 。 它 们 以 周期 性 间隔 出 现 (比如 : 每 9 个 帧 中 有 一 个 I 帧 )。I- 帧 
必须 是 周期 性 出 现 ， 因 为 该 帧 的 突然 变化 将 使 得 其 前 面 的 帧 和 后 面 的 帧 不 能 正常 显 
示 。 同 样 ， 当 播放 视频 的 时 候 ， 观 众 可 能 会 随时 调整 接收 机 。 如 果 仅 仅 在 播放 开始 时 
有 一 个 I- 帧 ,那么 随后 调整 频道 的 观众 将 不 能 收 到 完整 的 画面 。I- 帧 独立 于 其 他 帧 
之 外 ， 而 且 不 能 由 其 他 帧 构造 。 

。P- 帧 ， 预 帧 ， 与 前 面 的 I 帧 或 P- 帧 有 关联 。 换 句 话 说， 每 个 P- 帧 都 从 前 面 帧 变化 
而 来 。 不 过 变化 不 能 覆盖 大 的 部 分 。 例 如 ， 对 于 一 个 快速 移动 的 目标 ， 新 变化 也 许 没 
有 记录 在 P- 帧 中 。P- 帧 可 以 通过 先前 的 I- 帧 或 P- 帧 产生 。P- 帧 携带 的 信息 比 其 他 
类 型 的 帧 少 ， 而 且 压 缩 后 会 更 少 。 

。B- 帧 : 双向 帧 ， 与 前 面 和 后 续 的 工 帧 或 P- 帧 有 关系 。 换 句 话 说 ， 每 个 B- 帧 都 与 过 
去 和 将 来 有 关系 。 注 意 B- 帧 不 会 与 另 一 个 B- 帧 有 关系 。 

图 15-16 显示 了 帧 的 样本 序列 以 及 它们 是 如 何 构造 的 。 注 意 一 下 译 码 ， 译 码 过 程 应 该 

在 B- 帧 之 前 接收 到 P- 帧 ， 基 于 这 个 原因 ， 帧 发 送 的 顺序 与 它们 显示 在 接收 应 用 中 的 顺序 不 
同 。 帧 发 送 顺 序 为 : I, P, B, B, P, B, B, 1。 
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图 15-16 MPEG 帧 


版 本 

MPEG 有 很 多 版 本 。 上 面 讨论 的 是 与 MPEG-1 相关 的 ，MPEG-2 是 1991 年 引入 的 ，- 它 
的 能 力 比 MPEG-1 强 ， 既 能 用 作 视 频 存 储 ， 也 能 用 作 电 视 广播 ， 包 括 高 清 电 视 (HDTV)。 
MPEG 的 最 近 的 一 个 版 本 称 为 MPEG-7， 它 叫 作 “多 媒体 内 容 描述 接口 ”。MPEG-7 大 部 分 
是 使 用 XML 描述 元 数据 (关于 数据 的 数据 ) 和 对 视频 中 所 含 内 容 的 描述 的 标准 。 


15.3.3 ”音频 压缩 


音频 压缩 可 以 用 来 处 理 语 音 和 音乐 。 对 于 语音 ， 我 们 需要 压缩 一 个 64 kHz 的 数字 化 信 
号 ， 而 对 于 音乐 我 们 需要 压缩 一 个 1.411 MHz 的 信号 。 有 两 类 技术 用 来 进行 音频 压缩 ， 预测 
编码 和 感知 编码 。 

1. 预测 编码 

在 预测 编码 中 ， 样 本 间 的 差别 被 编码 ， 而 不 是 对 所 有 的 样本 值 进行 编码 。 这 样 压缩 方法 
通常 用 在 语音 上 。 已 经 定义 的 标准 有 : GSM ( 13 kbps)、G.729 (8 kbps) 和 G.723.3 ( 6.4 kbps 
或 5.3 kbps)。 这 些 技术 的 详细 讨论 超过 了 本 书 的 范围 。 

2. 感知 编码 : MP3 

用 来 创建 CD 质量 音频 最 常用 的 压缩 技术 是 基于 感知 编码 技术 的 。 这 种 类 型 的 音频 至 少 
为 1.411 Mbps。 所 以 如 果 没 有 压缩 ， 它 是 不 能 送 到 因特网 上 去 的 。MP3 (MPEG 第 三 代 音 频 
压缩 格式 )(MPEG 标准 的 一 部 分 ， 在 视频 压缩 小 节 中 讨论 过 ) 使 用 的 就 是 这 种 技术 。 

感知 编码 是 基于 心理 声学 的 ， 心 理 声 学 是 一 门 研究 人 类 是 如 何 感知 声音 的 科学 。 想 法 是 
基于 我 们 听觉 系统 的 甫 疲 ， 有 些 声音 能 够 掩盖 其 他 声音 。 掩 盖 可 以 发 生 在 频率 上 和 时 间 上 。 
在 频率 掩盖 中 ， 一 个 频率 范围 的 高 的 声音 可 以 部 分 或 完全 掩盖 另 一 个 频率 范围 的 低 的 声音 。 
例如 ， 在 一 个 有 高 音 重 金属 演出 的 房间 内 ， 我 们 就 不 能 听见 我 们 舞伴 的 说 话 声 。 在 时 间 掩 盖 
中 ， 即 使 在 高 音 停 止 后 ， 它 也 可 以 在 短 时 间 内 降低 我 们 听觉 灵敏 度 。 

MP3 使 用 这 两 种 现象 (频率 掩盖 和 时 间 掩 盖 ) 来 压缩 音频 信号 。 该 技术 分 析 音 谱 并 把 音 
谱 分 成 几 个 组 。0 位 被 赋 给 了 那些 频率 范围 被 完全 掩盖 的 ， 小 数值 的 位 被 赋 给 了 那些 频率 范 
围 部 分 被 掩盖 的 。 大 数值 的 位 被 赋 给 了 那些 不 被 掩盖 的 。 

MP3 有 三 种 速率 : 96 kbps、128 kbps 和 160 kbps。 速 率 是 基于 原始 模拟 音频 的 频率 范围 的 。 


15.4 章 末 材料 


推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
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e。 Drozdek, A. Elements of Data Compression, Boston, MA: Course Technology, 2001 
e。 Symes, P, Video Compression, New York: McGraw-Hill, 1998 


York: Chapman and Hall, 1997 


Haskell, B., Puri, A. and Netravali, A. Digital Video: An Introduction to MPEG2, New 


e。 Pennebaker, W. and Mitchell, J. JPEG Still Image Data Compression Standard, New 


York: Van Nostrand Reinhold, 1993 


关键 术语 


AC value (AC 值 ) 

bidirectioinal frame(B-frame， 双 癌 帧 ) 

data compression (数据 压缩 ) 

DC value (DC 值 ) 

dictionary-based encoding (基于 字典 的 编码 ) 

discrete cosine transform ( DCT， 离 散 余 弦 
变换 ) 

frequency masking (频率 掩盖 ) 

Huffman coding( 赫 夫 曼 编码 ) 

intracoded frame (I-frame， 内 部 编码 帧 ) 

Joint Photographic Experts Group (JPEG, 联 
合 图 像 专 家 组 ) 

Lempel Ziv encoding (Lempel Ziv (LZ) 编码 ) 

Lempel Ziv Welch encoding ( Lempel Ziv 


小 结 


Welch (LZW) 编码 ) 

lossless data compression (无 损 压缩 ) 

lossy data compression (有 损 压 缩 ) 

Moving Picture Experts Group (MPEG， 运 动 
图 像 专家 组 ) 

MPEG audio layer 3 (MP3，MPEG 第 三 代 音 
频 压缩 格式 ) 

perceptual encoding (感知 编码 ) 

predicted frame (P-frame， 预 帧 ) 

predictive encoding (预测 编码 ) 

run-length encoding (游程 长 度 编 码 ) 

spatial compression (空间 压缩 ) 

temporal compression〈 时 间 压 缩 ) 

temporal masking (时间 掩 盖 ) 


。 数据 压缩 方法 分 为 无 损 压缩 (所 有 信息 都 可 恢复 ) 和 有 损 压 缩 (部 分 信息 丢失 )。 
。 在 无 损 压 缩 方法 中 ， 接 收 的 数据 是 发 送 数 据 的 完全 复制 。 三 种 无 损 压 缩 方法 分 别 是 游 


程 长 度 编码 、 赫 夫 曙 编码 和 LZ 编码 。 


。 在 游程 长 度 编 码 中 ， 重 复出 现 的 符号 被 该 符号 和 表示 该 符号 重复 的 数字 所 替换 。 
。 在 赫 夫 曼 编码 中 ， 编 码 的 长 度 是 符号 频率 的 函数 ; 出 现 频 率 越 高 的 符号 相对 于 出 现 频 


率 较 低 的 符号 编码 长 度 越 短 。 


。 在 LZ 编码 中 ,重复 的 字符 串 或 字 以 变量 形式 保存 。 字 符 串 或 字 用 变量 的 索引 号 代 
蔡 。LZ 编码 在 接收 方 和 发 送 方 都 需要 一 个 字典 和 一 个 算法 。 
。 在 有 损 压 缩 中 ， 接 收 的 数据 并 不 需要 是 所 发 送 数据 的 完全 复制 。 本 章 讨论 的 三 种 有 损 


压缩 方法 分 别 是 JPEG、MPEG 和 MP3。 


。 联 合 图 像 专家 组 (JPEG) 是 一 种 用 来 压缩 图 形 和 图 像 的 方法 。JPEG 过 程 包 括 划分 块 、 


离散 余弦 变换 、 量 化 以 及 无 损 压 缩 。 


。 运动 图 像 专家 组 (MPEG) 是 一 种 用 来 压缩 视频 的 方法 。MPEG 包括 空间 和 时 间 压 缩 。 


前 者 和 JPEG 相似 ， 后 者 则 去 掉 了 多 余 的 帧 。 
。 MPEG 第 三 代 音 频 压 缩 格式 (MP3 ) 是 MPEG 标准 的 一 部 分 。MP3 使 用 感知 编码 技 


术 压 缩 CD 质量 音频 。 
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15.5 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复 习题 


Q15-1 数据 压缩 方法 有 哪 两 种 类 别 ? 

Q15-2 无 损 压 缩 和 有 损 压 缩 有 什么 不 同 ? 

Q15-3 什么 是 游程 长 度 编 码 ? 

Q15-4 LZ 编码 方法 是 怎样 减少 需要 传输 的 位 的 数量 的 ? 
Q15-5 什么 是 赫 夫 受 编 码 ? 

Q15-6 字典 在 LZ 编码 中 担当 什么 角色 ? 

Q15-7 相对 于 赫 夫 曼 编 码 ，LZ 编码 的 优点 是 什么 ? 
Q15-8 有 损 压 缩 的 三 种 方法 是 什么 ? 

Q15-9 什么 时 候 用 JPEG 格式 ， 什 么 时 候 用 MPEG 格式 ? 
Q15-10 JPEG 和 MPEG 有 什么 关系 ? 

Q15-11 在 JPEG 格式 中 分 块 有 什么 作用 ? 

Q15-12 在 JPEG 格式 中 为 什么 需要 离散 余弦 变换 ? 
Q15-13 量化 对 于 数据 压缩 有 何 贡 献 ? 

Q15-14 在 MPEG 压缩 中 什么 是 帧 ? 

Q15-15 ”相对 于 时 间 压 缩 而 言 空间 压缩 是 什么 ? 
Q15-16 讨论 MPEG 格式 中 三 种 不 同类 型 的 帧 。 


练习 题 


P15-1 对 下 面 的 位 模式 使 用 游程 长 度 编 码 方 式 进行 编码 ， 编 码 长 度 为 5 位 。 
18 个 0、11、56 个 0、1、15 个 0、11 
P15-2 对 下 面 的 位 模式 使 用 游程 长 度 编 码 方式 进行 编码 ， 编 码 长 度 为 5 位 。 
1 8 站 全 、 2、45 个 0 
P15-3 ”对 下 面 给 定 频 率 的 字符 进行 赫 夫 曼 编 码 。 
ACI2 和 BCS © (9 DUWDND I 到》 G0(8) 
P15-4 ”对 下 面 字符 使 用 赫 夫 曼 编码 ， 每 一 个 字符 有 相同 的 频率 ( 1 )。 
Ds 
P15-5 下 面 是 赫 夫 曼 编码 吗 ? 请 解释 。 
A: 0 B; 10 C: 11 
P15-6 下 面 是 赫 夫 曼 编 码 吗 ?请 解释 。 
A: 0 B:1 C: 00 D: 01 E: 10 F: 11 
P15-7 ”对 字符 串 BAABBBBAACAA 使 用 下 面 的 赫 夫 曼 编码 进行 编码 。 
A: 0 B: 10 C: 11 
P15-8 使 用 下 面 的 赫 夫 曼 编 码 对 0101000011110 进行 译 码 。 
A:0 B: 10 C: 11 
P15-9 使 用 Lempel Ziv 方法 对 信息 BAABBBBAACAA 进行 编码 ， 然 后 对 编码 消息 进行 译 码 ， 得 到 


源码 。 


286 “” 荔 135 汪 


P15-10 如果 字典 包含 ABB ， 使 用 Lempel Ziv 方法 对 字符 串 AAAABBCCCBBB (消息 的 一 部 分 ) 进 


行 编码 ， 并 显示 字典 的 最 终 内 容 。 
P15-11 DCT 的 求 值 需要 大 量 的 计算 ， 通常 是 由 计算 机 程序 来 进行 的 ， 不 用 DCT 而 使 用 下 列 规则 转 
换 一 个 2 x 2 的 表 : | 
7(0, 0) = (1/16)[P(0, 0) + P(0, 1) + P(1, 0) + P(1, 1)] 
7(0, 1) = (1/16)[0.95P(0, 0) + 0.9P(0, 1) + 0.85P(1, 0) + 0.80P(1, 1)] 
T(1, 0) = (1/16)[0.90P(0, 0) + 0.85P(0, 1) + 0.80P(1, 0) + 0.75P(1, 1)] 
T(1, 1) = (1/16)[0.85P(0, 0) + 0.80P(0, 1) + 0.75P(1, 0) + 0,70P(1, 1)] 
如 果 P(0, 0)=64, P(0, 1)=32, P(1, 0)=128, P(1, D)=148， 求 7(0, 0)、 7(0, 1)、 ZT(1, 0) 和 7(1, 1)。 


| 第 16 章 


Foundations of Computer Science, Fourth Edition 


i 


安全 这 个 话题 很 宽泛 并 且 包 括 数 学 中 的 某 些 特定 领域 ， 比 如 数论 。 本 章 尝试 简单 地 介绍 
这 一 话题 ， 并 为 深入 学 习 准 备 背 景 知识 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 ; 

。 定义 安全 目标 : 机 密 性 、 完 整 性 、 可 用 性 ; 

。 区 分 对 称 密 钥 密 码 和 非 对 称 密 钥 密码 以 及 它们 可 以 达到 的 机 密 性 程度 ; 

。 描述 安全 的 其 他 领域 : 消息 完整 性 、 消 息 验 证 、 数 字 签名 、 实 体验 证 和 密 钥 管理 ; 

。 理解 防火 墙 在 防止 有 害 消息 到 达 一 个 系统 中 的 作用 。 


16.1 引言 


我 们 生活 在 信息 时 代 ， 需 要 保存 生活 中 各 方面 的 信息 。 换 句 话说 ， 信 息 是 一 种 有 价值 的 
资产 ， 就 像 其 他 资产 一 样 。 作 为 一 种 资产 ， 信 息 需 要 保护 ， 免 受 攻击 。 为 了 安全 ， 信 息 需 要 
避 开 未 授权 的 使 用 (机密 性 )， 保 护 信息 不 受到 未 授权 的 签 改 (完整 性 )， 并 且 对 于 得 到 授权 
的 实体 来 说 是 需要 时 可 用 的 (可 用 性 )。 z 

在 过 去 30 年 间 ， 计 算 机 网 络 已 经 在 信息 的 使 用 上 创造 了 一 场 革命 。 现 在 的 信息 是 分 散 
的 。 被 授权 的 人 可 以 通过 计算 机 网 络 远 距 离 地 发 送 和 检索 信息 。 虽 然 以 上 提 到 的 三 个 要 求 一 
机 密 性 、 完 整 性 和 可 用 性 没有 改变 ， 但 它们 现在 包括 了 一 些 新 的 内 容 。 信 息 不 仅仅 应 该 在 存 
储 时 保密 ， 在 它 从 一 台 计算 机 传输 到 另 一 台 计 算 机 时 也 是 有 办 法 保持 机 密 性 的 。 

这 一 节 中， 我 们 先 讨论 信息 安全 的 三 个 主要 目标 ， 然 后 将 探索 攻击 是 如 何 威胁 这 三 个 目 
标的 。 然 后 我 们 将 讨论 和 这 些 安全 目标 有 关 的 安全 服务 ， 最 后 我 们 将 定义 两 个 实现 安全 目标 
并 且 防 止 攻击 的 技术 。 


16.1.1 安全 目标 


我 们 将 首先 讨论 三 个 安全 目标 : 机 密 性 、 完 整 性 和 可 用 性 。 

1. 机 密 性 

机 密 性 也 许 是 信息 安全 中 最 通常 的 方面 。 我 们 需要 保护 机 密 信 息 ， 需 要 一 个 组 织 来 看 护 
这 些 信 息 ， 以 防 那些 危及 信息 机 密 性 的 恶意 行为 。 机 密 性 不 仅仅 适用 于 信息 的 存储 ， 在 信息 
的 传输 中 它 也 得 到 了 应 用 。 当 我 们 将 一 小 段 信息 发 送 并 存储 至 远程 计算 机 或 从 远程 计算 机 上 
检索 一 段 信息 时 ， 需 要 在 传输 时 对 该 信息 进行 隐藏 。 


2. 完整 性 
信息 需要 不 停 地 变化 。 在 一 个 银行 中 ， 当 一 个 客户 存 钱 或 取 钱 时 ， 他 的 账户 余额 需要 


改变 。 完 整 性 的 意思 是 变化 只 应 该 由 授权 的 实体 通过 授权 的 机 制 来 完成 。 完 整 性 冲突 不 一 
定 是 由 于 恶意 行为 造成 的 ， 它 也 可 能 是 系统 中 断 (例如 短路 ) 造成 的 对 信息 的 一 些 不 希望 
的 改动 。 
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3. 可 用 性 
信息 安全 的 第 三 个 部 分 是 可 用 性 。 一 个 组 织 创建 和 存储 的 信息 对 授权 实体 来 说 应 该 是 


可 用 的 。 如 果 信 息 是 不 可 用 的 ， 那 它 就 是 无 用 的 。 信 息 需 要 时 常 改变 ， 这 就 意味 着 它 必须 对 ， 
那些 被 授予 访问 权限 的 实体 是 可 以 访问 的 。 信 息 的 不 可 用 性 对 组 织 是 有 害 的 ， 就 像 缺 乏 信息 
的 机 密 性 和 完整 性 一 样 。 想 象 一 下 ， 如 果 客 户 交易 时 不 能 访问 他 们 的 账户 ， 这 时 银行 会 发 生 
什么 。 


16.1.2 ”攻击 

三 个 安全 目标 (机 密 性 、 完 整 性 和 可 用 性 ) 会 受到 安全 攻击 的 威胁 。 虽 然 文 献 中 可 能 采 
用 不 同 的 方法 来 对 攻击 进行 分 类 ， 但 我 们 在 这 里 将 它们 按照 安全 目标 分 为 三 类 。 图 16-1 显 
示 了 该 分 类 。 


| 
4 
四 


NE pr Te 4 
对 完整 性 的 威胁 
图 16-1 与 安全 目标 有 关 的 攻击 分 类 





1. 威胁 机 密 性 的 攻击 
通常 有 两 种 攻击 威胁 到 信息 的 机 密 性 ， 嗅 探 和 流量 分 析 。 


嗅 探 
嗅 探 是 指 对 数据 的 非 授 权 访问 或 侦 听 。 例 如 ， 一 个 通过 因特网 传输 的 文件 可 能 含有 机 密 


的 信息 ， 一 个 非 授 权 的 实体 可 能 侦 听 到 传输 ， 并 为 了 自己 的 利益 使 用 其 中 的 内 容 。 为 了 防止 
嗅 探 ， 可 以 使 用 我 们 下 面 要 讨论 的 加 密 技 术 ， 以 使 得 数据 对 侦 听 者 来 说 难以 理解 。 

流量 分 析 

虽然 通过 加 密 技 术 我 们 可 以 使 得 数据 对 侦 听 者 来 说 难以 理解 ， 但 他 们 仍然 可 以 通过 在 线 
流量 监控 收集 其 他 类 型 的 信息 。 例 如 ， 他 们 能 找到 发 送 者 或 接收 者 的 电子 地 址 (如 电子 邮件 
地 址 )， 收 集 多 对 请 求 和 响应 ， 帮 助 猜测 交易 的 本 质 。 

2. 威胁 完整 性 的 攻击 

数据 的 完整 性 会 受到 多 种 攻击 的 威胁 : 签 改 、 假 冒 、 重 放 和 抵赖 。 

算 改 

侦 听 或 访问 信息 后 ， 攻 击 者 自 改 信息 ， 使 得 信息 有 利于 他 们 。 例 如 ， 一 个 客户 可 能 向 银 
行 发送 一 消息 去 完成 一 些 交易 。 攻 击 者 侦 听 到 信息 ， 并 为 了 自己 的 利益 自 改 了 交易 的 类 型 。 
注意 ， 有 时 攻击 者 可 能 仅仅 是 删除 或 延迟 了 这 个 消息 来 危害 这 个 系统 或 者 使 他 们 自己 受益 。 


交会 289 


假冒 
当 攻 击 者 冒充 其 他 人 时 ,假冒 或 哄骗 就 发 生 了 。 例 如 ， 一 个 攻击 者 可 能 盗窃 银行 卡 和 银 


行 客户 的 PIN 而 假装 是 这 个 客户 。 有 时 攻击 者 则 假冒 接收 实体 。 比 如 ， 一 个 用 户 尝试 联系 
一 家 银行 ， 但 是 另 一 个 站 点 伪装 成 银行 网 站 并 从 用 户 那里 得 到 了 一 些 信息 。 

重 放 

重 放 是 另 一 种 类 型 的 攻击 。 攻 击 者 得 到 用 户 发 送 的 消息 的 副本 ， 过 后 设法 重 放 它 。 例 
如 ， 一 个 客户 向 他 的 银行 发 送 了 一 条 给 攻击 者 付款 的 请 求 ， 攻 击 者 侦 听 到 这 个 消息 ， 再 次 发 
送 这 条 消息 ， 想 从 银行 得 到 另 一 次 付款 。 

抵赖 

抵赖 是 一 种 不 同 于 其 他 类 型 的 攻击 ， 因 为 它 是 由 通信 双方 中 的 一 个 来 进行 的 : 发 送 者 或 
接收 者 。 消 息 的 发 送 者 后 来 可 能 抵赖 他 发 送 了 消息 ; 消息 的 接收 者 后 来 也 可 能 抵赖 他 接收 到 
消息 。 一 个 发 送 者 抵赖 的 例子 可 能 如 ， 一 个 银行 客户 要 求 银行 给 第 三 方 送 钱 ,但 后 来 他 否认 
自己 做 过 这 样 的 请 求 。 一 个 接收 者 抵赖 的 例子 可 能 如 ， 某 人 向 一 制造 商 购 买 产品 ， 并 电子 付 
款 ， 但 制造 商 后 来 否认 已 经 收 到 付款 而 要 求 再 付 。 

3. 威胁 可 用 性 的 攻击 

我 们 在 这 里 只 讨论 一 种 威胁 可 用 性 的 攻击 : 拒绝 服务 。 

拒绝 服务 

拒绝 服务 (DoS) 攻击 是 很 常见 的 ， 它 可 能 减 慢 或 完全 中 断 系 统 的 服务 。 攻 击 者 能 使 用 
几 种 策略 取得 这 样 的 效果 。 他 们 可 能 通过 发 送 大 量 虚假 请 求 使 系统 变 得 非常 忙碌 而 崩溃 ， 或 
他 们 可 能 侦 听 并 删除 服务 器 对 客户 端的 响应 ， 使 客户 端 相信 服务 器 未 响应 。 攻 击 者 也 通过 侦 
听 客 户 端的 请 求 ， 使 得 客户 端 多 次 发 送 请求 导 致 系统 变 得 非常 忙碌 。 


16.1.3 ”服务 和 技术 


为 了 达到 安全 目标 和 防止 受到 安全 攻击 ，ITU-T 定义 了 一 些 安全 服务 的 标准 。 这 些 服务 
中 的 每 一 个 都 是 为 了 在 维护 安全 目标 时 防止 一 个 或 多 个 攻击 而 设计 的 。 实 际 完成 安全 目标 需 
要 一 些 技术 手段 ， 现 今 流行 两 种 技术 : 一 种 是 非常 普通 的 密码 术 ; 一 种 是 特殊 的 隐 写 术 。 

1. 密码 术 

有 些 安全 服务 可 以 使 用 密码 术 来 实现 。 密 码 术 (希腊 起 源 的 单词 ) 意思 是 “秘密 书写 ”。 
但 是 ， 我 们 使 用 这 个 词 是 指 为 使 消息 安全 并 对 攻击 免疫 而 进行 转换 的 科学 和 艺术 。 虽 然 在 过 
去 密码 术 只 是 指使 用 密 钥 进行 消息 的 加 密 和 解密 ， 但 如 今 它 被 定义 成 三 种 不 同 的 机 制 对 称 
密 钥 密码 、 非 对 称 密 钥 密码 和 散 列 。 本 章 稍 后 会 讨论 这 三 种 机 制 。 

2. 隐 写 术 

虽然 本 章 和 接 下 来 的 部 分 以 密码 术 作 为 实现 安全 机 制 的 一 种 技术 ， 但 另 一 种 过 去 用 于 秘密 通 
信和 的 技术 现在 正在 复苏 ， 它 就 是 隐 写 术 。 单 词 隐 写 术 (起 源 于 希腊 语 ) 意思 是 “掩饰 书写 "， 而 
对 应 的 密码 术 的 意思 是 “秘密 书写 ”。 密 码 术 就 是 通过 加 密 把 消息 中 的 内 容 隐藏 起 来 ; 而 隐 写 术 
是 通过 在 消息 上 覆盖 其 他 内 容 而 隐藏 消息 。 隐 写 术 的 具体 内 容 将 留 给 该 话题 的 其 他 书籍 讨论 。 


16.2 机密 性 
现在 我 们 来 看 第 一 个 安全 目标 ， 机 密 性 。 机 密 性 可 以 通过 使 用 密码 达到 。 密 码 术 可 以 分 
成 两 大 类 ， 对 称 密 钥 密码 术 和 非 对 称 密 钥 密码 术 。 
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16.2.1 ”对称 密 钥 密码 术 


对 称 密 钥 密码 术 使 用 了 同一 个 密 钥 进行 加 密 和 解密 ， 并 且 这 个 密 钥 可 以 用 来 进行 双向 通 
信 ， 这 就 是 为 什么 它 被 称 为 对 称 的 。 图 16-2 显示 了 对 称 密 钥 密码 术 的 基本 思想 。 


安全 密 钥 交换 通道 





图 16-2 ”对称 密 钥 密码 术 的 基本 思想 


“对 称 密 钥 密码 术 也 称 为 保密 密 钥 密码 术 。 re 

在 图 16-2 中 ，Alice 通 过 一 个 不 安全 的 通道 向 Bob 发 送 一 则 消息 ， 假 设 一 个 敌手 Eve 
在 通道 上 简单 地 偷 听 ， 但 她 不 能 理解 消息 的 内 容 。 

从 Alice 到 Bob 的 原始 消息 称 为 明文 ， 而 通过 通道 发 送 的 消息 称 为 密 文 。 为 了 从 明文 创 
建 密 文 ，Alice 使 用 了 一 个 加 密 算法 和 一 个 共享 密 铀 。 

为 了 从 密 文 创建 明文 ，Bob 使 用 了 一 个 解密 算法 和 一 个 相同 的 密 钥 。 我 们 把 加 密 和 解密 
算法 称 为 密码 。 密 钥 是 密码 (一 个 算法 ) 操作 中 的 一 组 值 (数字 )。 

注意 ， 对 称 密 钥 加 密 对 加 密 和 解密 使 用 一 个 密 钥 ( 密 钥 本 身 可 以 是 一 串 数 值 )。 此 外 ， 
加 密 算法 和 解密 算法 是 互 道 的 。 如 果 己 为 明文 ，C 是 密 文 , 玉 是 密 钥 ， 加 密 算法 Ex(x) 从 明 
文 建立 了 密 文 ， 而 解密 算法 Dx(x) 从 密 文 建立 了 明文 。 我 们 推断 Er(x) 和 Dx(x) 是 互 逆 的 : 
如 果 对 一 个 输入 依次 施加 Ex(x) 和 Dx(x)， 它 们 的 作用 会 相互 抵消 。 我 们 有 : 

加 密 : C=Ex(P) 解密 : P=Dx(C) 

在 这 里 ，Dx(Ex(x)) = Ex(Dx(x)) = x。 需 要 强调 的 是 ， 最 好 可 以 将 加 密 和 解密 算法 公开 但 
是 把 共享 密 钥 保密 。 这 意味 着 Alice 和 Bob 需要 另外 一 个 (安全 的 ) 通道 来 交换 密 钥 。Alice 
和 了 Bob 可 能 会 面 ， 亲 自 交换 密 钥 ， 这 里 的 安全 通道 就 是 面对面 交换 密 钥 。 他 们 也 可 以 相信 
第 三 方 给 他 们 的 相同 的 密 钥 ， 或 者 他 们 可 以 使 用 另外 一 种 密码 ( 非 对 称 密码 ， 我 们 后 面 会 谈 
到 ) 来 建立 临时 的 密 钥 。 

加 密 可 以 看 作 把 消息 锁 进 箱子 ， 而 解密 可 以 看 成 打开 箱子 。 在 对 称 密 钥 加 密 中 ， 用 相同 
的 密 钥 来 锁 和 打开 “箱子 ”， 如 图 16-3 所 示 。 在 下 一 节 中 我 们 会 看 到 非 对称 密 钥 加 密 需 要 两 
个 密 钥 ， 一 个 用 于 上 锁 而 另 一 个 则 用 于 开锁 。 





16-3 ”对 称 密 钥 加 密 可 以 看 作用 相同 的 密 钥 上 锁 和 开锁 
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我 们 可 以 把 对 称 密 钥 密码 分 成 两 大 类 : 传统 对 称 密 钥 密码 和 现代 对 称 密 钥 密码 。 传 统 密 
码 很 简单 ， 面 向 字符 的 密码 对 现在 的 标准 而 言 是 不 安全 的 。 另 一 方面 ， 现 代 密 码 是 更 为 安全 
的 复杂 的 面向 位 的 密码 。 我 们 将 简单 讨论 传统 密码 为 讨论 更 复杂 的 现代 密码 做 铺垫 。 

1. 传统 对 称 密 钥 密码 

传统 密码 属于 过 去 。 然 而 ， 因 为 它们 被 视 为 现代 密码 的 构成 要 素 ， 所 以 我 们 在 这 里 对 其 
进行 简要 讨论 。 更 确切 地 说 ， 我 们 把 传统 密码 分 为 替换 密码 和 移 位 密码 。 

替换 密码 

替换 密码 用 一 个 符号 蔡 换 另 一 个 符号 。 如 果 在 明文 中 的 符号 是 字母 表 的 字符 ， 我 们 用 另 
一 个 字符 来 代替 。 例 如 ， 我 们 能 用 字母 D 代替 字母 A， 用 字母 Z 代 蔡 字母 T。 如 果 符 号 是 
数字 《0 一 9 )， 我 们 能 用 7 代替 3, 用 6 代替 2。 


”着 换 密码 就 是 用 一 个 符号 蔡 代 另 二 个 符号 


蔡 换 密码 主要 可 以 分 成 单字 母 密码 和 多 字母 密码 。 

单字 母 密码 

在 单字 母 密码 中 ， 明 文中 相同 的 字符 (或 符号 ) 在 密 文中 用 相同 的 字符 (或 符号 ) 替换 ， 
与 该 字符 在 明文 中 的 位 置 无 关 。 例 如 ， 如 果 算 法 定义 将 明文 中 所 有 的 字母 A 都 替代 成 为 字 
母 D， 那 么 所 有 的 字母 A 都 将 换 成 字母 D。 换 名 话说， 明文 和 密 文中 的 字符 关系 是 一 一 对 
应 的 。 

最 简单 的 单字 母 密码 就 是 加 法 密码 (或 者 移 位 密码 ) 。 假 设 明文 由 小 写字 母 (a 一 z) 构 
成 ， 密 文中 包括 大 写字 母 ( A~Z), 为 了 使 数学 的 计算 操作 可 以 施加 在 明文 和 密 文 上 ， 我 们 
同 每 一 个 字母 (无论 大 小 写 ) 都 进行 赋值 ， 如 图 16-4 所 示 。 
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图 16-4 模 26 中 明文 和 密 文字 符 的 表示 
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在 图 16-4 中 ， 每 一 个 字母 (无 论 大 小 写 ) 都 赋予 了 一 个 模 26 中 的 整数 。Alice 和 Bob 
之 间 的 密 钥 也 是 模 26 中 的 一 个 整数 。 加 密 算法 将 密 钥 加 上 明文 字符 ， 解 密 算法 从 密 文字 符 
人 所 有 操作 都 在 模 26 中 完成 。 

“在 加 法 密码 中 ， 阴 文 、 密 文 和 密 钥 前 是 模 26 中 的 回 数 。 

历史 上 ， SR pp ‘向 下 移 位 key we 
符 "， 而 解密 算法 可 以 解释 成 “向 上 移 位 key 个 字符 ”。 尤 利 乌 斯 . 恺 撒 (Julius Caesar) 与 
他 的 军官 是 使 用 密 钥 为 3 的 加 法 密码 进行 通信 的 。 正 是 由 于 这 个 原因 ， 加 法 密码 有 时 也 称 为 


a 





使 用 密 钥 为 15 的 加 法 密码 加 密 消息 “hello”。 
角 我 们 对 明文 一 个 字 行 一 个 华 行 二 天 二 和 
明文 ; h 一 07 加 密 :; (07+15) mod 26 密 文 ; 22 一 WW 


明文 e 一 04 加 密 : (04+15) mod 26 密 文 19 一 T 
明文 : 1 一 11 加 密 : (11+15) mod 26 密 文 ， 00 一 A 
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明文 ; 1 一 11 加 密 : (i1i+15) mod 26 密 文 : 00 一 A 
明文 ; o 一 14 加 密 : (14+15) mod 26 北 文 . 03 一 D 


因此 密 文 是 “WTAAD”。 注 意 ， 这 个 密码 是 单字 母 的 ， 因 为 实例 中 两 个 相同 的 明文 字 


符 (1) 加 密 成 了 相同 的 字符 (A)。 
有 虽 13 和 使 用 密 钥 为 15 的 加 法 密码 解密 消息 “WTAAD”。 
解 ” 我 们 对 密 文 一 个 字符 一 个 字符 地 使 用 解密 算法 : 





密 文 ; W 一 22 解密 : (22 一 15) mod 26 . 明文 : 07 一 hh 
窗 文 ; T 一 19 解密 ; (19 一 15) mod 26 明文 04 一 e 
密 文 ; A 一 00 解密 ; (00 一 15) mod 26 明文 : 11 一 1 
密 文 A 一 00 解密 ; (00 一 15) mod 26 明文 11 一 1 
密 文 ; D 一 03 解密 : (03 一 15) mod 26 明文 14 一 D 


因此 明文 是 “ hello”。 注 意 ， 这 些 过 程 是 在 模 26 中 完成 的 ， 所 以 我 们 需要 向 一 个 负 值 


上 加 26 (例如 ，-15 变 成 11 )。 


多 字母 密码 
在 多 字母 密码 中 ， 字 符 的 每 一 次 出 现 都 使 用 不 同 的 替换 码 。 明 文中 字符 和 密 文中 字符 


的 关系 是 一 对 多 ,例如 ,， “a” 既 可 以 在 文本 开头 加 密 成 “D"， 也 可 以 在 中 间 加 人 密 成 “N”。 
多 字母 密码 具有 可 以 隐藏 原 有 语言 的 字母 频率 的 作用 ， 即 使 通过 单字 母 频率 统计 都 无 法 破解 
密 文 。 

为 了 创造 一 个 多 字母 密码 ， 我 们 对 每 一 个 密 文 字符 的 确定 都 不 仅 取决 于 相对 应 的 明文 
字符 ， 还 与 该 明文 字符 在 原来 文本 中 的 位 置 有 关 。 这 意味 着 我 们 的 密 钥 应 该 是 子 密 钥 流 ， 这 
个 子 密 钥 流 中 的 每 一 个 子 密 钥 都 在 某 种 程度 上 取决 于 使 用 该 子 密 钥 进行 加 密 的 明文 字符 的 位 
置 。 换 句 话 说 ， 我们 需要 有 一 个 密 钥 流 本 (hi, 局, bh,…)， 在 这 里 用 来 对 明文 中 第 i 项 的 字 
符 加 密 并 创造 密 文 中 的 第 i 项 字符 。 

为 了 更 好 地 解释 密 钥 的 位 置 依赖 性 ， 我 们 先 讨论 一 个 叫 作 自 动 密 钥 密码 的 简单 多 字母 密 
码 。 在 这 个 密码 中 ， 密 钥 是 一 个 子 密 钥 流 ， 在 这 个 子 密 钥 流 中 的 每 一 个 子 密 钥 都 用 来 对 明文 
文本 中 的 对 应 字符 进行 加 密 。 第 一 个 子 密 钥 是 Alice 和 Bob 事先 同意 并 秘密 设 定 的 值 ， 第 二 
个 子 密 钥 是 明文 中 第 一 个 字符 的 值 (在 0 一 25 之 间 )。 第 三 个 子 密 钥 是 第 二 个 明文 字符 的 值 ， 


以 此 类 推 。 


Pep PyPy C=CICaC3… k= (上 大， 已 ，PI，… ) 
加 密 ，C= (Pi + KK) mod 26 解密 : P= (Ci -上 ) mod 26 


这 种 密码 的 名 字 “ 自 动 密 铀 密码 ”说 明了 这 些 子 密 钥 都 是 在 加 密 过 程 中 通过 明文 密码 字 


符 自动 创造 的 。 
六 本 [5 和 假设 Alice 和 Bob 同意 使 用 一 个 初始 密 钥 值 为 和 =12 的 自动 密 钥 密码 ， 现 在 
Alice 想 发 一 条 叫 作 “ Attack is today” 的 消息 。 加 密 的 过 程 是 一 个 字符 接着 一 个 字符 进行 
的 ， 明 文中 的 每 一 个 字符 先 替 换 成 代表 它 的 整数 值 。 第 一 个 密 钥 和 第 一 个 明文 字符 的 整数 值 
相 加 以 得 到 第 一 个 密 文字 符 ， 剩 下 的 密 钥 在 阅读 明文 字符 时 产生 。 注 意 ， 由 于 明文 中 出 现 的 
3 个 “a” 和 3 个 “t” 都 是 通过 不 同方 式 加 密 的 ， 所 以 这 个 密码 是 多 字母 密码 。 

i 

P 的 值 00 19 19 00 02 10 08 18 19 14 03 00 24 

密 钥 流 12 00 19 19 00 02 10 08 18 19 14 03 00 
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C 的 值 12 19 12 19 02 12 18 00 11 7 17 03 24 
密 文 MT MT C MS A L HR D Y 


移 位 密码 
移 位 密码 不 是 用 一 个 符号 代替 另 一 个 符号 ， 而 是 改变 符号 的 位 置 。 明 文 第 一 个 位 置 上 的 


符号 可 能 出 现在 密 文 的 第 十 个 位 置 上 ， 而 明文 第 八 个 位 置 上 的 符号 可 能 出 现在 密 文 的 第 一 个 
位 置 上 。 换 言 之 ， 移 位 密码 就 是 符号 的 重新 排序 。 

假设 Alice 需要 向 Bob 发 送 消息 “Enemy attacks tonight”。 加 密 和 解密 的 过 程 见 图 16-5。 
注意 ， 我 们 在 消息 的 末尾 加 上 一 个 额外 的 字符 (z) 这 样 字符 个 数 就 是 5 的 倍数 。 


Alice Bob 


他 i 名 
enemyattackstonightz enemyattackstonightz 


一 行 一 行 写 一 行 一 行 读 


EM YN 
9 Wh 人 


四 了 





ETTHEAK JMAOTYCNZNTSG ETTHEAK JIMAOTY 


密 广 传输 密 广 
图 16-5 移 位 密码 


第 一 张 表 是 Alice 通过 一 行 一 行 写 明文 创造 的 。 每 一 列 都 利用 同一 个 密 钥 进行 变更 。 密 
文通 过 一 列 一 列 读 第 二 张 表 得 到 。Bob 将 这 三 步 操 作 反 向 进行 来 进行 解密 。 他 将 密 文 一 列 一 
列 写 人 第 一 张 表格 中 对 每 列 进行 变更 ， 然 后 一 行 一 行 读 第 二 张 表 。 注 意 ， 这 里 用 来 进行 加 密 
和 解密 的 密 钥 是 相同 的 ， 但 是 算法 使 用 密 钥 的 顺序 是 互 逆 的 。 

2. 流 密码 和 分 组 密码 

文献 中 将 对 称 密码 分 为 两 大 组 : 流 密 码 和 分 组 密码 。 

流 密码 

在 流 密码 中 ， 加 密 和 解密 都 是 一 次 只 对 一 个 符号 (例如 一 个 字符 或 位 ) 进行 。 我 们 有 一 
个 明文 流 、 一 个 密 文 流 和 一 个 密 钥 流 。 将 明文 流 称 为 已 ， 密 文 流 称 为 C， 密 钥 流 称 为 K。 


PePPPy, C=CICzC3… K=(ki,ka,ks,.…) 
C=En(P,)) C=En(P;) C3=En(P;): “0 
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分 组 密码 
在 分 组 密码 中 ,一 组 大 小 为 六 ( m>1 ) 的 明文 符号 被 加 密 在 一 起 ， 创 造 一 组 同样 大 小 的 


密 文 。 基 于 定义 ,在 一 个 分 组 密码 中 ， 整 个 分 组 是 由 一 个 单独 的 密 钥 进行 加 密 ， 即 使 这 个 密 
钥 由 多 个 值 构 成 。 在 分 组 密码 中 ， 密 文 的 分 组 取决 于 整个 明文 分 组 。 

组 合 

在 实际 操作 中 ， 每 个 明文 分 组 是 分 别 加 密 的 ,但 是 同时 密 钥 流 被 用 来 对 整个 消息 按照 
分 组 依次 加 密 。 换 句 话 说 ， 当 我 们 看 每 一 个 单独 分 组 时 ， 该 密码 是 分 组 密码 ， 但 是 从 整个 消 
息 来 看 ， 这 是 一 个 以 分 组 为 单位 进行 加 密 的 流 密码 。 每 个 分 组 都 使 用 一 个 不 同 的 密 钥 进行 加 
密 ， 这 些 密 钥 是 在 加 密 进行 之 前 或 进行 过 程 中 产生 的 。 

3. 现代 对 称 密 钥 密码 

我 们 到 现在 为 止 研究 的 传统 对 称 密 钥 密码 都 是 面向 字符 的 密码 。 由 于 计算 机 的 进步 ， 我 
们 需要 面向 位 的 密码 。 这 是 由 于 需要 加 密 的 消息 已 经 不 仅仅 是 文本 ， 它 也 有 可 能 包括 数字 、 
图 表 、 音 频 和 视频 数据 。 在 这 个 情况 下 ， 更 方便 的 方法 是 把 这 些 类 型 的 数据 转换 成 比特 流 然 
后 再 对 流 进 行 加 密 ， 然 后 发 送 加 密 后 的 流 。 除 此 之 外 ， 当 文本 在 比特 级 进行 处 理 时 ， 每 个 字 
符 会 替换 为 8 (或 16) 位 ， 这 也 意味 字符 数 也 变 成 了 原来 的 8 (或 16 ) 倍 大 。 将 更 多 的 字符 
混合 可 以 提高 安全 性 。 现 代 密 码 既 可 以 是 分 组 密码 也 可 以 是 流 密码 。 

现代 分 组 密码 

对 称 密 钥 现代 分 组 密码 对 大 小 为 n 位 的 明文 分 组 进行 加 密 或 对 同样 大 小 的 密 文 分 组 进行 
解密 。 加 密 或 解密 算法 使 用 位 的 密 钥 。 解 密 算法 必须 是 加 密 算法 的 逆 运 算 ， 并 且 两 个 操作 
必须 使 用 相同 的 密 钥 ， 这 样 Bob 可 以 检索 到 Alice 发 送 的 消息 。 图 16-6 显示 了 现代 分 组 密 
码 中 加 密 和 解密 的 大 体 思 想 。 

当 消息 的 长 度 小 于 ?位 时 ， 消 息 后 会 加 
上 补丁 以 使 消息 长 度 达到 一 个 nn 位 的 分 组 ; 
如 果 消 息 长 度 超 过 nn 位 ， 消 息 就 会 被 分 成 几 
个 长 度 为 n 位 的 分 组 ， 如 果 必 要 ， 那 么 相应 
的 补丁 会 添加 到 最 后 一 个 分 组 上 。n 的 常用 数 
值 是 64、128、256 和 512 位 。 图 16-6 ”现代 分 组 密码 

现代 流 密码 

除了 现代 分 组 密码 以 外 ， 我 们 也 可 以 使 用 现代 流 密码 。 现 代 流 密码 和 现代 分 组 密码 的 
差别 类 似 于 我 们 在 之 前 部 分 提 到 的 传统 的 流 密码 和 分 组 密码 之 间 的 差别 。 在 现代 流 密码 中 ， 
加 密 和 解密 都 是 每 次 对 > 位 进行 。 我 们 有 一 个 表示 为 P=p,…pzpi 的 明文 流 ， 一 个 表示 为 
=c,…Cc2Cc1， 的 密 文 流 和 一 个 表示 为 =h，…keh 的 密 钥 流 ; 在 这 里 p;、c;、k 都 是 长 度 为 位 
的 词 。 加 密 算法 是 c=E(5，p)， 解 密 则 表现 为 p=D(h，ci)。 流 密码 比分 组 密码 更 快 ， 它 的 
硬件 实现 也 更 简单 一 些 。 当 我 们 需要 对 二 进 制 流 加 密 并 将 加 密 后 的 流 匀速 传输 时 ， 流 密码 是 
一 个 更 好 的 选择 。 流 密码 对 于 传输 中 发 生 的 损毁 也 有 更 好 的 免疫 能 力 。 

最 简单 也 最 安全 的 同步 流 密码 是 吉尔 伯 特 ' 弗 纳 姆 发 明 并 取得 专利 的 一 次 一 密 乱 码 。 一 
次 一 密 乱 码 每 次 加 密 时 使 用 随机 选择 的 密 钥 流 。 加 密 和 解密 都 使 用 单一 的 异 或 操作 。 基 于 异 
或 操作 的 性 质 ， 加 密 和 解密 的 算法 互 为 逆 运算 。 有 一 点 需要 重视 的 是 ， 这 个 密码 中 的 异 或 操 
作 一 次 只 用 一 比特 。 同 样 需 要 重视 的 是 Alice 还 需要 一 个 安全 通道 来 将 密 钥 流 序 列 发 给 Bob 
(图 16-7 ) 。 


k 位 密 钥 





女 2 








图 16-7 一 次 一 密 乱 码 


一 次 一 密 乱 码 是 一 个 理想 化 的 密码 ， 它 很 完美 ， 不 仅 敌 手 无 法 猜测 密 钥 或 者 明文 与 密码 
的 统计 ， 明 文 和 密 文 之 间 也 没有 任何 联系 。 换 句 话 说 ， 即 使 明文 有 某 种 规律 ， 密 文 仍然 是 真 
正 的 比特 乱码 流 。 除 非 Eve 尝试 了 所 有 可 能 的 随机 密 钥 流 ， 她 不 可 能 强行 破解 这 个 密码 。 同 
时 ， 当 明文 的 长 度 为 n 位 时 ， 她 就 需要 尝试 2" 次。 然而 这 就 引申 出 了 一 个 问题 ， 每 次 当 发 
送 者 和 接收 者 交流 时 他 们 应 该 如 何 分 享 一 次 一 密 乱 码 密 钥 呢 ? 他 们 需要 通过 某 种 方法 在 随机 
密 铀 上 达成 共识 。 因 此 ， 这 个 完美 的 理想 密码 很 难 实现 。 不 过 ,一 次 一 密 乱 码 也 有 一 些 可 行 
但 是 安全 性 较 低 的 版 本 ， 一 个 较 常 见 的 选择 叫 作 反馈 移 位 寄存 器 (FSR)， 不 过 我 们 将 把 有 关 
这 个 有 趣 的 密码 的 讨论 留 给 主攻 安全 方面 话题 的 书籍 。 


16.2.2 ” 非 对 称 密 钥 密码 术 


前 一 节 讨 论 了 对 称 密 钥 密码 。 本 节 将 开始 有 关 非 对 称 密 钥 密 码 的 讨论 。 对 称 和 非 对 称 密 
钥 密 码 平行 存在 着 并 继续 为 社区 服务 。 实 际 上 ， 我 们 相信 他 们 可 以 取长补短 ， 相 互补 充 。 

从 概念 上 来 说 ， 这 两 种 系统 的 差别 在 于 它们 是 如 何 保守 秘密 的 。 在 对 称 密 钥 密码 术 中 ， . 
密码 必须 在 双方 之 间 共 享 。 在 非 对称 密 钥 密 码 术 中 ， 秘 密 是 个 人 独 有 的 ( 非 共 享 的 )， 每 个 


人 创造 并 保守 个 人 的 秘密 。 
在 有 nn 个 人 的 社区 中 ，n(n-1)/2 个 共享 的 秘密 需要 对 称 密 钥 密码 术 来 完成 ， 如 果 只 及 n 


个 秘密 则 使 用 非 对 称 密 钥 密码 术 。 对 于 一 个 人 口 为 100 万 的 社区 来 说 ， 对 称 密 钥 密码 术 需 要 
500 万 个 共享 秘密 ， 而 非 对 称 密 钥 密 码 术 只 需要 100 万 个 个 人 秘密 。 


“对 称 密 铀 密码 术 基于 共享 保密 ; 非 对 秘密 铜 密码 术 基于 个 人 保密 2 


安全 性 在 加 密 以 外 还 有 其 他 方面 需要 非 对 称 密 钥 密码 术 ， 这 些 方面 包括 身份 验证 和 数字 
签名 。 无 论 一 个 应 用 是 否 基于 个 人 秘密 ， 我 们 都 需要 使 用 非 对 称 密 钥 密码 术 。 

与 对 称 密 钥 密码 术 基 于 符号 (字符 或 位 ) 的 替换 和 排列 不 同 ， 非 对 称 密 钥 密码 术 基于 数 
学 函数 在 数字 上 的 应 用 。 在 对 称 密 钥 密码 术 中 ， 明 文 和 密 文 被 看 作 符号 的 组 合 ， 加 密 和 解密 
是 对 这 些 符 号 的 排列 或 相互 替换 。 在 非 对 称 密 钥 密码 术 中 ， 明 文 和 密 文 都 是 数字 ， 加 密 和 解 
密 的 过 程 是 对 数字 应 用 数学 函数 并 创造 其 他 数字 的 过 程 。 


“对称 密 钥 密 码 术 对 字符 进行 排列 或 替换 ; 非 对 称 密 铀 密码 玉 对 数字 进行 操作 


在 非 对 称 密 钥 密 码 术 中 使 用 两 个 分 开 的 密 钥 : 私 钥 和 公 钥 。 如 果 把 加 密 和 解密 想象 成 带 
有 钥匙 的 挂 锁 的 锁 上 和 打开 ， 那 么 用 公 钥 锁 上 的 挂 锁 只 能 被 相应 的 私 钥 打 开 。 图 16-8 中 显 
示 如 果 Alice 用 Bob 的 公 钥 锁 上 挂 锁 ， 那 么 只 有 Bob 的 私 钥 才能 打开 它 。 

从 图 上 可 以 看 出 ， 非 对 称 密 钥 密码 术 和 对 称 密 钥 密码 术 不 同 的 地 方 在 于 它 使 用 不 同 的 密 
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钥 : 私 钥 和 公 钥 。 虽 然 有 些 书 上 会 用 密 铀 代 兰 私 钥 ， 我 们 只 有 在 讨论 对 称 密 钥 密码 术 时 使 用 
术语 密 钥 ， 私 钥 和 公 负 为 非 对 称 密 钥 密码 术 的 特有 术语 。 我 们 甚至 使 用 不 同 的 符号 来 表示 这 
三 种 密 钥 ， 换 名 话说， 这 是 为 了 说 明 密 钥 和 私 钥 是 不 可 互 换 的 ， 它 们 属于 不 同 的 类 型 。 





图 16-8 非 对 称 密 钥 密码 术 中 的 开锁 和 上 锁 


非 对 称 密 负 密码 有 时 也 称 为 公 负 密 码 。 


1. 主要 思想 
图 16-9 展示 了 非 对 称 密 钥 密码 术 进 行 加 密 时 的 主要 思想 。 


到 公众 
+ 全 





图 16-9 非 对 称 密 钥 密码 术 进行 加 密 时 的 主要 思想 


图 16-9 说 明了 几 个 重要 的 事实 。 首 先 ， 它 强调 了 密码 系统 的 非 对 称 本 性 。 提 供 安 全 的 
重担 落 在 接收 者 的 肩 上 ， 这 里 是 Bob。Bob 需要 创建 两 个 密 钥 : 一 个 私 钥 和 一 个 公 钥 。 他 有 
义务 把 公 钥 分 发 给 团体 。 这 可 以 通过 公 钥 分 发 通道 来 完成 。 虽 然 此 通道 不 需要 保证 安全 ， 但 
它 必 须 提 供 身 份 验 证 和 数据 完整 性 。Eve 应 该 不 能 把 她 的 公 钥 假装 为 Bob 的 公 钥 公布 给 团体 。 

其 次 ， 非 对 称 密 钥 密码 术 意 味 着 Bob 和 Alice 在 双向 通信 中 不 能 使 用 同一 组 密 钥 。 在 通 
信 中 的 每 个 个 体 应 该 创建 自己 的 私 钥 和 公 钥 。 图 16-9 显示 了 Alice 使 用 Bob 的 公 钥 ， 发 送 
加 密 消 息 给 Bob。 如 果 Bob 需要 回应 ,那么 Alice 就 需要 建立 她 自己 的 私 钥 和 公 和 钥 。 

再 次 ， 非 对 称 密 钥 密码 术 意 昧 着 Bob 只 需要 一 个 私 钥 就 能 从 团体 中 的 任何 人 那里 接收 
信息 。 但 Alice 需要 n 个 公 钥 与 团体 中 的 nn 个 人 进行 通信 ， 一 人 一 个 公 和 钥 。 总 之 ，Alice 需 
要 一 个 公 钥 环 。 

明文 / 密 文 

与 对 称 密 钥 密码 术 不 同 ， 在 非 对 称 密 钥 密码 术 中 ， 明 文 和 密 文 被 当 作 整数 来 对 待 。 在 加 
密 之 前 ， 消 息 必 须 被 编码 成 一 个 整数 (或 一 组 整数 )， 在 解密 之 后 整数 (或 一 组 整数 ) 必须 译 
码 成 消息 。 非 对 称 密 钥 密码 术 通 常 被 用 来 加 密 或 解密 小 段 信息 ， 例 如 对 称 密 钥 密码 术 中 的 密 
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码 密 钥 。 换 名 话说， 非 对 称 性 密 钥 密码 术 通 常 起 到 辅助 目标 而 不 是 加 密 消息 的 作用 。 然 而 ， 
这 个 辅助 目标 在 当今 的 密码 术 中 发 挥 了 很 重要 的 作用 。 


“ 非 对 称 密 钥 密码 术 通常 用 来 加 密 或 解密 小 段 信息 。 


加 密 /解密 

在 非 对 称 密 钥 密码 术 中 的 加 密 和 解密 是 作用 在 表示 明文 和 密 文 的 数字 上 的 数学 函数 。 密 
文 可 以 被 看 成 C=f (Kpwwic, P)， 而 明文 可 以 看 成 P= g(Kyrivne, C)， 其 中 解密 函数 了 只 用 来 加 
密 ， 而 解密 函数 g 只 用 来 解密 。 

两 个 系统 都 需要 

很 重要 但 有 时 会 被 误解 的 一 个 事实 是 : 非 对 称 密 钥 ( 公 钥 ) 密码 术 的 提 及 不 代表 着 对 对 
称 密 钥 (秘密 密 钥 ) 密码 术 需 求 的 减少 ， 因 为 需要 通过 数学 函数 进行 加 密 和 解密 的 非 对 称 密 
钥 密码 术 比 对 称 密 钥 密码 术 慢 得 多 。 对 称 密 钥 密码 术 仍 然 用 于 对 较 长 消息 的 加 密 。 在 另 一 方 
面 ， 对 称 密 钥 密 码 术 的 速度 快 也 没有 减少 对 非 对 称 密 钥 密码 术 的 需求 。 身 份 验证 、 数 字 签 名 
和 秘密 密 钥 交换 仍然 需要 用 到 非 对 称 密 钥 密码 术 。 这 就 意味 着 ， 我 们 需要 将 对 称 密 钥 密码 术 
和 非 对 称 密 钥 密 码 术 相互 配合 使 用 才能 使 用 到 当今 安全 性 的 每 一 个 领域 。 

2. RSA 密码 系统 

虽然 有 几 种 非 对 称 密 钥 密 码 系统 ， 但 最 常用 的 公 钥 算法 之 一 是 RSA 密码 系统 (以 发 明 
者 Ron Rivest、Shamir 和 Adleman 命名 )。RSA 使 用 两 个 指数 e 和 d， 其 中 e 是 公 铀 ，d 是 
私 钥 。 假 设 己 代表 明文 而 C 代表 密 文 ， 那 么 Alice 使 用 C=P* mod n 的 算法 从 明文 P 中 得 到 
密 文 C ; Bob 通过 P=C?” mod n 来 检索 Alice 发 送 的 明文 。 在 密 钥 生成 的 过 程 中 创造 了 一 个 
很 大 的 数 作为 模 数 n。 

过 程 

图 16-10 展示 了 RSA 过 程 的 大 体 思 想 。 


和 党 择 2 和 1 2 
ka eflg 





16-10 加密、 解密 和 RSA 中 的 密 钥 生成 


Bob 选择 了 两 个 素数 p 和 4g， 计算 n=pXg 和 gqg(n)=(p-1)X(q-1)。 然 后 Bob 选择 e 和 
d， 这 样 (eX4d) mod gpg(n)=1。Bob 的 公 和 钥 是 n 和 ee， 他 的 私 钥 是 d4。 任 何人 ， 包 括 Alice， 都 
可 以 通过 C=Pemod n 加 密 一 条 消息 并 发 送 给 Bob， 而 Bob 则 通过 P=C” mod n 来 解密 消息 。 
像 Eve 这 样 的 窃听 者 无 法 在 pz 和 4 是 很 大 的 数字 时 破解 这 则 消息 (她 不 知道 4)。 
吕 是 [了 站 为 了 进行 示范 ，Bob 选择 了 p=7 和 4%=11， 计 算出 n=7X11=77。 那 么 p(n)=(7-1) 
(11-D)， 或 者 60。 如 果 他 把 e 选 择 为 13， 那么 4 就 是 37。 注 意 ，eXd mod 60=1。 现 在 假设 
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Alice 要 向 Bob 发 送 明文 为 5 的 信息 。 她 使 用 公共 指数 13 来 加 密 明 文 5。 该 系统 不 是 安全 
的 ， 因 为 p 和 9g 很 小 。 


明文 : $ 密 文 ， 26 
C=5'"=26 mod 77 =26”=5 mod 77 
密 文 ; 26 明文 : 5 


这 里 有 一 个 更 实际 的 通过 Java 计算 机 程序 进行 计算 的 例子 。 我 们 选择 一 个 
512 位 的 p 和 4g， 计算 n 和 gp(n)。 接 下 来 我 们 选择 一 个 e 并 且 计 算 4。 最 后 我 们 展示 加 密 和 
解密 的 结果 。 整 数 p 是 一 个 159 位 数 的 数字 : 
p= 96130345313583504574191581280615427909309845594996215822583 
15087964794045505647063849125716018034750312098666606492420 
191808780667421096063354219926661209 
整数 g 是 一 个 160 位 数 的 数字 : 
dg = 12060191957231446918276794204450896001555925054637033936061 
79832173148214848376465921538945320917522527322683010712069 
5604602513887145524969000359660045617 
模 数 n=pXgq。 它 有 309 位 数 。 
n= , 115935041739676149688925098646158875237714573754541447754855 
261376147885408326350817276878815968325168468849300625485764 
11125016241455233918292716250765677272746009708271412773043 
49605005563472745666280600999240371029914244722922157727985 
317270338393813346926841373276220009666766718318310883734208 





23444370953 
4$(n)=(p-1)(q-1) 有 309 位 数 。 
p(n)= 11593504173967614968892509864615887523771457375454144775485526137 


61478854083263508172768788159683251684688493006254857641112501624 
14552339182927162537656751054233608492916752034482627988117554787 
65701392344440571668658172819609822636107546721186461217135910735 
8640614008885170265377277264467341066243857664128 

Bob 选择 了 e=35 535 (最 理想 的 是 65 537 )， 然 后 得 到 d。 

e= ! 35535 

d= 580083028600377639360936612896779175946690620896509621804228661113 
805938528223587317062869100300217108590443384021707298690876006115 
306202524959884448047568240966247081485817130463240644077704833134 
010850947385295645071936774061197326557424237217617674620776371642 
0760033708533328853214470885955136670294831 

Alice 想 发 送 消 息 “ THIS IS A TEST”， 这 个 消息 可 以 通过 00-26 编码 表 (26 是 空格 符 ) 

改 成 一 个 数值 。 

P= 190708182608182619041819 

Alice 的 密 文通 过 C= P* 计 算 ， 如 下 所 示 。 

C= 47530912364622682720636555061054518094237179607049171652323924305 


入 人 在 “2%9 


44529606131993285666178434183591141511974112520056829797945717360 
36101278218847893741566090480023507190715277185914975188465888632 
10114835410336165789846796838676373376577746562507928052114814184 
404814184430812773059004692874248559166462108656 

Bob 可 以 利用 P= C “将 原文 从 密 文 中 还 原 出 来 ， 如 下 所 示 。 


P= 190708182608182619041819 
解密 还 原 出 来 的 明文 是 “THIS IS A TEST”。 
3. 应 用 


虽然 RSA 可 以 用 于 对 实际 消息 进行 加 密 和 解密 ， 但 如 果 消 息 很 长 加 密 的 速度 会 很 慢 。 
因此 ，RSA 加 密 适 用 于 短 消 息 。RSA 特定 用 于 数字 签名 以 及 其 他 不 需要 使 用 对 称 密 钥 来 对 
较 短 信息 进行 加 密 的 密码 。RSA 也 适用 于 身份 验证 ， 这 个 我 们 会 在 本 章 的 后 面 提 到 。 


16.3 ”其 他 安全 服务 


到 目前 为 止 我 们 研究 的 密码 系统 提供 了 机 密 性 ， 但 在 现代 通信 中 ， 还 需要 考虑 安全 的 其 
他 方面 ， 比 如 完整 性 、 消 息 和 实体 验证 、 不 可 抵赖 性 和 密 钥 管 理 。 我 们 将 在 本 节 简 要 讨论 。 


16.3.1 消息 完整 性 


有 些 场合 我 们 可 能 不 需要 保密 ， 但 却 需 要 完整 性 : 消息 应 该 是 不 受 改动 的 。 例 如 ， 
Alice 可 能 写 一 份 遗嘱 在 她 死 后 来 分 配 她 的 财产 ， 遗 嘱 不 需要 被 加 密 ， 她 死 之 后 ， 任 何人 能 
检查 它 ， 但 是 遗嘱 的 完整 性 却 需要 保证 。Alice 不 希望 遗嘱 的 内 容 在 她 不 知道 的 情况 下 被 
自 改 。 

1. 消息 和 消息 摘要 

保证 文档 完整 性 的 一 种 方法 是 通过 使 用 指纹 。 如 果 Alice 需要 保证 她 的 文档 的 内 容 不 被 
算 改 ， 可 以 在 文档 的 底部 印 上 她 的 指纹 。 因 为 Eve 不 能 伪造 Alice 的 指纹 ， 所 以 Eve 不 能 算 
改 文档 的 内 容 或 创建 一 个 假 的 文档 。 为 了 确保 文档 没 被 算 改 过， 文档 上 的 Alice 指纹 会 与 文 
件 中 的 Alice 指纹 进行 比较 。 如 果 不 同 ， 那 文档 就 不 是 来 自 Alice 的 。 文 档 和 指纹 对 的 电子 
等 价 物 就 是 消息 和 摘要 对 。 为 了 保证 消息 完整 性 ， 消 息 要 通过 一 个 称 为 密码 散 列 函数 的 算 
法 。 函 数 建立 消息 的 压缩 影像 ( 称 为 摘要 )， 这 个 影像 就 像 指纹 一 样 使 用 。 为 了 检查 消息 或 
文档 的 完整 性 ，Bob 再 次 运行 密码 散 列 函数 ， 并 比较 新 摘要 与 之 前 的 摘要 ， 如 果 相 同 ，Bob 
就 能 确保 原始 消息 没有 被 自 改 过 。 图 16-11 展示 了 该 思想 。 





图 16-11 消息 和 摘要 
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两 对 (文档 /指纹 和 消息 / 消息 摘要 ) 是 相似 的 ， 但 有 一 些 区 别 。 文 档 和 指纹 在 物理 上 
链接 在 一 起 。 消 息 和 消息 摘要 可 以 不 链接 (或 单独 发 送 )， 最 重要 的 是 消息 摘要 需要 保证 安 


全 ， 免 受 算 改 。 

消息 摘要 需要 保证 安全 ， 免 受 莫 改 。  ，，， 

2. 散 列 函数 

散 列 函数 将 任意 长 度 的 消息 加 密 成 为 固定 长 度 的 消息 摘要 。 所 有 的 散 列 函数 加 密 都 需要 
从 长 度 不 一 的 消息 中 创造 出 长 度 固 定 的 消息 摘要 。 建 造 这 样 一 个 功能 最 好 由 壕 代 完成 ， 创 造 
一 个 有 着 固定 输入 值 并 且 可 以 使 用 必需 的 次 数 的 函数 ， 而 不 是 使 用 输入 值 大 小 可 变 的 散 列 函 
数 。 这 里 的 固定 输入 值 函数 指 的 是 压缩 务 数 ， 它 将 nn 位 的 一 串 字 符 压 缩 并 创造 成 m 位 的 字 
符 早 ， 这 里 的 i 通常 大 于 m。 该 方案 被 称 为 过 代 加 密 散 列 函 数 。 

罗 因 ， 李维斯 设计 的 几 个 散 列 算法 被 称 为 MD2、MD4 和 MD5， 这 里 的 MD 代表 消息 
摘要 。 最 新 的 版 本 (MD5 ) 是 MD4 的 一 个 加 强 版 ， 它 可 以 将 消息 分 成 长 度 为 512 位 的 分 组 
并 创造 大 小 为 128 位 的 摘要 。 然 而 ， 事 实证 明 大 小 为 128 位 的 消息 摘要 太 小 了 以 至 于 不 能 阻 
挡 攻 击 。 | 

因此 ， 为 了 回应 MD 散 列 算法 的 不 安全 性 ， 安 全 散 列 算法 诞生 了 。 安 全 散 列 算法 
(SHA) 是 由 国家 标准 与 技术 研究 所 (NIST) 研制 的 一 个 标准 。SHA 经 过 了 几 个 版 本 。 


16.3.2 消息 验证 

消息 摘要 可 以 检验 消息 的 完整 性 ， 保 证 消息 没 被 算 改 。 为 了 确保 消息 的 完整 性 以 及 数 
据 源 的 身份 验证 一 这 消息 是 真 的 来 自 Alice 而 不 是 任何 其 他 的 人 ， 我们 需要 在 过 程 中 包括 
一 个 Alice 和 Bob 共享 的 秘密 (没有 经 过 Eve); 我 们 需要 创造 一 个 消息 验证 码 ( Message 
Authentication Code，MAC)。 图 16-12 展示 了 这 个 思想 。 





16-12 ”消息 验证 码 


Alice 使 用 散 列 函数 从 密 钥 和 消息 连接 中 创建 了 一 个 MAC， 即 h(K+M)。 她 在 不 安全 的 
通道 上 把 消息 和 MAC 发 送 给 Bob。Bob 把 消息 与 MAC 分 开 ， 然 后 从 消息 和 密 钥 的 连接 中 
建立 新 的 MAC， 然 后 比较 新 建 的 MAC 和 收 到 的 MAC， 如 果 两 个 MAC 匹配 ， 那 么 消息 就 


得 到 验证 ， 并 没有 被 敌手 算 改 过 。 : 
注意 ， 在 这 种 情况 下 不 需要 使 用 两 条 通道 。 消 息 和 MAC 都 是 在 相同 的 不 安全 通道 上 发 


i 


送 的 。Eve 可 以 看 见 消息 ， 但 她 不 能 伪造 一 个 新 的 消息 来 替换 ， 因 为 她 不 拥有 Alice 和 Bob 
本 的 窗 钢 ， 她 不 能 像 Alice 一 样 创建 相同 的 MAC。 


MAC 通过 散 列 函 数 和 密 钥 的 组 合 来 保证 消息 的 完整 性 和 消息 验证 。 


HMAC 
国家 标准 与 技术 研究 所 ( NIST) 发 布 了 新 一 代 MAC 标准 ， 通 常 称 为 HMAC ( 散 列 消息 
验证 码 )。HMAC 的 实施 比 简化 的 MAC 更 复杂 ， 因 此 本 书 不 包含 此 部 分 内 容 。 


16.3.3 ”数字 签名 


保证 消息 完整 性 和 消息 验证 (还 有 更 多 我 们 将 很 快 看 到 的 安全 服务 ) 的 另 一 种 方法 是 数 
字 签 名 。MAC 过 过 轴 久 深 保 扩 浊 加 摘要 ， 到 地 竹 名 草 使 用 一 组 公 科 衣 。 


“数字 签名 使 用 一 组 公私 钥 。 


我 们 大 家 都 熟悉 签名 这 个 概念 。 当 一 个 人 在 文档 上 签名 就 表示 该 文档 是 起 源 于 他 或 他 已 
同意 的 。 签 名 对 接收 者 来 说 是 文档 来 自 正确 实体 的 证 据 。 例 如 ， 当 客户 签 了 一 张 支票 ， 银 行 
就 需要 确信 支票 是 客户 签署 的 ， 而 不 是 其 他 人 。 换 言 之 ,文档 上 的 签名 是 身份 验证 的 标记 ， 
它 验 证 通过 ， 文 档 就 可 和信。 这 里 签名 概念 也 可 以 看 作 艺 术 家 在 画 上 的 签名 ， 艺 术 上 的 签名 如 
果 得 到 验证 通过 ， 那 么 这 幅 画 通常 也 是 可 验证 通过 的 。 

当 Alice 向 Bob 发 送 消 息 时 ，Bob 需要 检查 发 送 者 的 身份 ， 他 需要 确信 消息 来 自 Alice 
而 不 是 Eve。Bob 可 以 要 求 Alice 对 信息 进行 电子 签名 。 换 言 之 ， 一 个 电子 签名 能 证 明 Alice 
作为 消息 发 送 者 的 身份 。 我 们 把 这 种 签名 称 为 数字 签名 。 

1. 对 比 

在 普通 签名 和 数字 签名 间 有 几 点 不 同 。 

包含 

普通 签名 是 包含 在 文档 里 的 ， 是 文档 的 一 部 分 。 当 我 们 写 支 票 时 ， 签 名 就 在 支票 上 ， 而 
不 是 一 个 分 开 的 文档 。 但 是 当 对 文档 进行 数字 签名 时 ， 我 们 把 签名 作为 一 个 单独 的 文档 来 
发 送 。 

验证 手段 

两 种 签名 的 第 二 点 不 同 在 于 签名 验证 的 方法 不 同 。 对 于 普通 签名 ， 当 接收 者 接收 到 一 个 
文档 时 ， 他 们 比较 文档 上 的 签名 与 文件 中 的 签名 ， 如 果 相 同 ， 文 档 就 是 可 信 的 。 接 收 者 需要 
有 一 个 文件 上 签名 的 副本 来 作 比 较 。 对 于 数字 签名 ， 接 收 者 接收 到 消息 和 签名 ， 签 名 的 副本 
不 再 保存 ， 接 收 者 需要 应 用 验证 技术 来 组 合 消息 和 签名 ， 从 而 验证 发 送 者 的 身份 。 

关系 

对 于 普通 签名 来 说 ， 签 名 和 文档 之 间 通 常 是 一 对 多 的 关系 ， 一 个 人 使 用 相同 的 签名 签署 
许多 文档 。 但 是 对 于 数字 签名 来 说 ， 签 名 和 消息 之 间 是 一 对 一 的 关系 。 每 条 消息 有 它 自 己 的 
签名 。 一 条 消息 的 数字 签名 不 能 用 在 另 一 条 消息 上 。 如 果 Bob 从 Alice 处 接收 到 两 条 消息 ， 
一 条 接着 一 条 ， 他 不 能 用 第 一 条 消息 的 签名 去 验证 第 二 条 。 每 条 消息 都 有 新 的 签名 。 

复制 性 

两 种 签名 的 另 一 点 不 同 是 称 为 复制 性 的 特质 。 普 通 签名 允许 签署 文档 的 副本 与 文件 中 
的 原始 件 有 点 不 同 。 对 于 数字 签名 ， 就 没有 这 样 的 不 同 ， 除 非 在 文档 上 有 时 间 因 子 (如 时 间 
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惟 )。 人 例如， 假设 Alice 发 送 文 档 ， 指示 Bob 给 Eve 付款 ， 如 果 Eve 截获 到 文档 和 签名 ， 她 
可 以 随后 重复 这 些 文档 和 签名 ， 再 次 从 Bob 处 得 到 钱 。 


2. 过 程 
图 16-13 显示 了 数字 签名 的 过 程 。 发 送 者 使 用 签名 昔 法 去 签署 消息 ， 消 息 和 签名 被 发 送 


给 接收 者 。 接 收 者 收 到 消息 和 签名 ， 对 收 到 的 内 容 应 用 验证 算法 ， 如 果 结 果 是 真 ， 消 息 被 接 
受 ， 和 否则， 消息 被 拒绝 。 
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图 16-13 ”数字 签名 过 程 


普通 签名 就 像 属 于 文档 签署 者 的 私 钥 一 样 。 签 署 者 使 用 它 签署 文档 ， 没 有 其 他 人 能 有 这 
个 签名 。 文 件 上 的 签名 副本 就 像 公 钥 ， 所 以 任何 人 都 能 使 用 它 通 过 与 原始 签名 的 比较 来 验证 
文档 。 

对 于 数字 签名 ， 签 署 者 使 用 他 (或 她 ) 的 私 钥 (应 用 于 一 个 签名 算法 ) 去 签署 文档 。 另 
一 方面 ， 验 证 者 使 用 签署 者 的 公 钥 (应 用 于 一 验证 算法 ) 验证 文档 。 

注意 ， 当 一 个 文档 被 签署 ， 任 何人 (包括 Bob) 都 能 验证 它 ， 因 为 任何 人 都 能 访问 Alice 
的 公 钥 。Alice 一 定 不 能 用 公 钥 去 签署 文档 ， 因 为 任何 人 都 能 伪造 她 的 签名 。 

我 们 能 否 用 一 个 密 钥 (对 称 的 ) 来 签署 和 验证 签名 ? 答案 是 否定 的 ， 有 以 下 几 个 原 
因 。 首 先 ， 密 钥 是 只 有 双方 知道 的 (这 个 例子 中 是 Alice 和 Bob)。 因 此 如 果 Alice 需要 签 
稼 男 一 份 文档 ， 并 发 送 给 Ted， 那 她 就 需要 使 用 另外 的 密 钥 。 其 次 ， 我 们 将 看 到 ， 为 一 个 
对 话 创建 密 钥 涉及 验证 ， 而 验证 要 使 用 数字 签名 。 因 此 ， 我 们 就 遇 到 一 个 错误 的 循环 。 再 . 
次 ，Bob 可 以 使 用 他 和 Alice 间 的 密 钥 签署 一 个 文档 ， 把 它 发 送 给 Tde， 假装 这 是 来 自 
Alice 的 。 

_ 这 者 用 入 角 作 习 ， 验 证 者 用 共 吕 者 拘 公 鲍 给 证 。 

我 们 需要 区 分 数字 签名 中 的 私 钥 和 公 钥 以 及 在 为 了 机 密 性 的 密码 系统 中 的 公 钥 和 私 钥 。 
后 者 ， 接 收 者 的 公 钥 和 私 钥 被 用 在 处 理 过 程 中 ， 发 送 者 使 用 接收 者 的 公 和 钥 进 行 加 密 ， 接 收 者 
使 用 他 自己 的 私 钥 进 行 解密 。 在 数字 签名 中 ， 发 送 者 的 私 钥 和 公 钥 被 使 用 。 发 送 者 使 用 他 
(或 她 ) 的 私 钥 ， 而 接收 者 使 用 发 送 者 的 公 钥 。 


密码 系统 使 用 接收 才 的 私 铀 和 公 钢 ; 效 字符 名 合用 发 送 者 的 私 铀 和 公 钥 。 


3. 签署 摘要 

当 处 理 较 长 消息 时 ， 非 对 称 密 钥 密码 系统 的 效率 低下 。 在 数字 签名 系统 中 ， 消 息 通 党 
较 长 ， 但 我 们 不 得 不 使 用 非 对 称 密 钥 模 式 。 解 决 方法 是 签署 消息 的 摘要 ， 该 摘要 比 消 息 本 身 
要 短 得 多 。 一 个 仔细 选择 的 消息 摘要 与 消息 具有 一 对 一 的 关系 。 发 送 者 可 以 签署 消息 摘要 ， 
接收 者 可 以 验证 消息 摘要 ， 两 者 的 效果 是 相同 的 。 图 16-14 显示 了 在 数字 签名 系统 中 摘要 的 


签 督 。 
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图 16-14 签署 摘要 


摘要 从 Alice 端的 消息 中 制造 出 来 。 然 后 摘要 通过 了 使 用 Alice 私 钥 的 签署 过 程 ，Alice 
把 消息 和 签名 发 给 Bob。 

在 Bob 端 ， 使 用 相同 的 公开 的 散 列 函数 ， 一 个 摘要 就 从 接收 到 的 消息 中 制造 出 来 。 应 
用 验证 过 程 。 如 果 可 信 ， 消 息 被 接受 ， 否 则 ， 消 息 被 拒绝 。 

4. 服务 

我 们 在 本 章 的 开头 讨论 了 几 个 安全 服务 ， 包 括 消 息 机 密 性 、 消 息 验证 、 消 息 完 整 性 和 不 
可 抵赖 性 。 

消息 验证 

一 个 安全 的 数字 签名 模式 就 像 一 个 安全 的 普通 签名 (也 就 是 说 一 个 人 不 容易 复制 ) 一 样 
能 提供 消息 验证 ， 也 称 为 数据 源 验 证 。Bob 能 验证 Alice 发 送 过 来 的 信息 是 因为 在 验证 过 程 
中 使 用 了 Alice 的 公 钥 。Alice 的 公 钥 不 能 验证 用 Eve 私 钥 签署 的 签名 。 

消息 完整 性 

如 果 我 们 签署 消息 或 消息 的 摘要 ， 消 息 的 完整 性 就 能 被 保护 ， 因 为 如 果 消 息 改变 了 ， 我 
们 就 不 能 得 到 相同 的 摘要 。 当 今 的 数字 签名 模式 在 签署 和 验证 算法 中 使 用 了 散 列 函数 ， 这 样 
更 好 地 保护 了 消息 的 完整 性 。 

不 可 抵赖 性 

如 果 Alice 签署 了 一 个 消息 ， 然 后 否认 它 ，Bob 能 否 证 明 Alice 实际 上 是 签署 了 它 呢 ? 
例如 ， 如 果 Alice 向 银行 (Bob) 发 送 消息 ， 要 求 从 她 的 账户 转 10 000 美元 到 Ted 的 账户 ， 
Alice 能 否 事后 否认 她 发 送 过 这 样 的 消息 ?使 用 我 们 目前 为 止 介绍 的 模式 ，Bob 可 能 会 有 一 
个 问题 。Bob 必须 先 保存 签名 ， 然 后 用 Alice 的 公 钥 去 建立 原始 消息 ， 去 证 明文 件 中 的 信息 
和 新 创建 的 消息 是 相同 的 。 但 这 样 并 不 可 行 ， 因 为 Alice 这 时 可 能 已 经 更 换 了 私 钥 或 公 钥 。 
她 也 可 以 声称 含有 签名 的 文件 是 不 可 信 的 。 

一 个 解决 方案 就 是 可 信和 的 第 三 方 。 人 们 可 以 在 他 们 之 间 建 立 可 信 中 心 。 在 本 章 的 后 面 ， 
我 们 将 看 到 受到 信任 的 第 三 方 可 以 解决 有 关 安 全 服务 和 密 钥 交换 的 很 多 问题 。 图 16-15 展示 
了 一 个 可 靠 的 第 三 方 如 何 防止 Alice 抵赖 她 发 过 的 消息 。 

在 这 种 模式 下 ，Alice 从 她 的 消息 创建 一 个 签名 ( SA)， 发 送 她 的 消息 、 她 的 标识 、Bob 
的 标识 和 签名 到 可 信 中 心 。 中 心 在 检查 Alice 的 公 钥 是 合法 的 之 后 ， 通 过 Alice 的 公 钥 验证 
消息 来 目 Alice。 然 后 可 信 中 心 把 带 有 发 送 者 标识 、 接 收 者 标识 和 时 间 惟 的 消息 的 副本 保存 
在 档案 中 。 中 心 使 用 它 的 私 钥 由 消息 创建 男 一 个 签名 ( Sr)， 然 后 中 心 把 消息 、 新 的 签名 、 
Alice 的 标识 和 Bob 的 标识 发 送 给 Bob。Bob 使 用 可 信 中 心 的 公 钥 验证 信息 。 

如 果 将 来 某 个 时 候 Alice 抵赖 她 发 送 的 消息 ， 中 心 就 可 以 显示 出 保存 消息 的 副本 。 因 为 
Bob 的 消息 是 保存 在 可 信 中 心 的 消息 的 一 个 副本 ， 所 以 ，Alice 将 会 在 争辩 中 输 掉 。 为 了 使 
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得 任何 东西 变 得 机 密 ， 一 定 程度 的 加 密 和 解密 可 以 加 到 此 模式 中 ， 下 一 节 将 介绍 。 





M: 消息 可 入 中 心 的 公 钥 外 人 
S。: Alice 的 签名 - 
Si+: 可 信 中 心 的 签名 












可 信 中 心 


WS) a amr, 


图 16-15 使 用 可 信 中 心 实现 不 可 抵赖 性 


机 密 性 
数字 签名 不 提供 机 密 通 信 ， 如 果 机 密 性 是 需要 的 ， 那么 消息 和 签名 就 要 使 用 对 称 密 钥 密 


码 或 非 对 称 密 钥 密码 进行 加 密 。 

签名 人 Alice 首先 通过 一 个 商定 的 散 列 函数 D=h(M) 从 消息 中 创建 一 个 摘要 ， 然 后 她 通 
过 5=D" mod n 对 摘要 签名 。 这 个 信息 和 签名 都 发 送 给 Bob。Bob 收 到 消息 和 签名 后 首先 通过 
Alice 的 公共 指数 D'=5* mod n 检索 摘要 ， 然 后 他 对 收 到 的 消息 应 用 散 列 算法 得 到 D=h(M)。 
现在 Bob 对 比 两 个 摘要 D 和 D'， 如 果 它 们 相等 (在 模 数 代数 中 )， 他 接受 这 个 消息 。 


16.3.4 实体 验证 

实体 验证 用 来 使 得 一 方 证 明 另 一 方 标识 的 一 种 技术 。 一 个 实体 可 以 是 一 个 人 、 一 个 过 
程 、 一 个 客户 端 或 一 个 服务 器 。 身 份 需要 证 明 的 实体 称 为 要 求 者 。 试 图 证 明 要 求 者 身份 的 一 
方 称 为 证 明 者 。 

1. 实体 验证 与 消息 验证 

在 消息 验证 (数据 源 验证 ) 和 实体 验证 间 有 两 点 区 别 : 

1 ) 消息 验证 (或 数据 源 验 证 ) 可 能 不 会 发 生 在 实时 系统 中 ， 而 实体 验证 是 会 的 。 在 前 
面 的 例子 中 ，Alice 发 送 一 条 消息 给 Bob。 在 Bob 验证 消息 的 时 候 ，Alice 可 能 在 或 可 能 不 
在 通信 的 过 程 中 。 在 另 一 方面 ， 当 Alice 要 求实 体验 证 时 ， 没 有 实际 消息 通信 被 涉及 ， 直 到 
Alice 的 身份 被 Bob 验证 。Alice 需要 在 线 参加 这 个 过 程 。 只 有 她 的 身份 被 验证 后 ， 消 息 才 
能 在 Alice 和 Bob 间 传 输 。 当 一 则 电子 邮件 从 Alice 到 Bob， 这 时 需要 的 是 数据 源 验 证 ; 当 
Alice 从 自动 取款 机 上 取现 金 时 ， 这 时 需要 实体 验证 。 

2 ) 消息 验证 简单 地 验证 一 则 消息 ， 这 个 过 程 需 对 每 则 新 的 消息 重复 。 实 体验 证 可 在 整 
个 会 话 期 间 内 验证 要 求 者 。 

2. 验证 分 类 

在 实体 验证 中 ， 要 求 者 必须 向 证 明 者 标识 自己 。 这 可 以 使 用 下 面 三 种 证 据 中 的 一 种 : 所 
知道 的 、 所 拥有 的 或 所 固有 的 。 

。 所 知道 的 。 这 是 一 种 只 有 要 求 者 知道 的 秘密 ,证明 者 可 以 通过 它 来 检查 要 求 者 。 这 样 

的 例子 有 : 密码 、PIN 码 、 密 钥 和 私 钥 。 | 
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。 所 拥有 的 。 这 种 东西 能 证 明 要 求 者 的 身份 。 这 样 的 例子 有 : 护照 、 驾 驶 证 、 身 份 证 、 
信用 卡 和 智能 卡 。 
。 所 固有 的 。 这 是 要 求 者 内 在 固有 的 特性 。 这 样 的 例子 有 : 普通 签名 、 指 纹 、 声 音 、 面 
部 特征 、 视 网 膜 模 型 和 手迹 。 
在 这 部 分 我 们 只 讨论 第 一 种 验证 ， 所 知道 的 。 这 种 验证 通常 用 作 远 程 (在 线 ) 实体 验 
证 。 另 外 两 个 分 类 则 通常 在 要 求 者 个 人 出 现时 使 用 。 
3. 密码 
最 简单 且 最 古老 的 实体 身份 验证 的 方法 是 基于 密码 的 身份 验证 ， 密 码 是 要 求 者 知道 的 一 
些 东 西 。 当 用 户 需 要 访问 系统 资源 时 (登录 )， 他 就 需要 一 个 密码 。 每 个 用 户 都 有 一 个 用 户 
标识 ， 这 是 公开 的 ; 还 有 一 个 密码 ， 这 是 私有 的 。 然 而 ， 密 码 在 攻击 面前 很 脆弱 。 密 码 可 能 
被 欠 取 、 截 获 或 猜 出 等 。 


4. 质询 - 响应 
在 密码 验证 中 ， 要 求 者 通过 展示 他 们 知道 秘密 (密码 ) 来 证 明 他 们 的 身份 。 但 是 要 求 者 


暴露 了 这 个 秘密 ， 就 容易 受到 敌手 的 截获 。 在 质询 - 响应 身份 验证 中 ， 要 求 者 能 证 明 他 知道 
秘密 而 不 需要 暴露 它 。 换 言 之 ， 要 求 者 没有 把 秘密 发 送 给 证 明 者 ， 但 证 明 者 或 者 有 它 ， 或 者 


能 找到 它 。 
一 在 质询 -响应 身份 验证 中 ;要求 者 证 明 他 们 知道 秘密 ;而 不 需要 把 秘密 暴露 给 证 明 者 。 
质询 是 一 个 随时 间 变化 的 值 ， 如 随机 数 或 一 个 时 间 蕉 ， 它 由 证 明 者 发 送 给 要 求 者 。 要 求 
者 对 质询 运用 一 个 函数 ， 把 结果 ( 称 为 响应 ) 发 送 给 证 明 者 。 响 应 表明 要 求 者 知道 秘密 。 
使 用 对 称 密 铀 密码 
有 几 种 方法 可 以 利用 对 称 密 铀 加 密 来 进行 质询 - 响应 身份 验证 。 这 里 共享 的 秘密 是 要 求 


者 和 证 明 者 都 知道 的 共享 密 钥 。 使 用 对 称 密 钥 密码 的 作用 是 对 质询 应 用 加 密 算法 。 虽 然 达到 
这 个 手段 有 几 种 方法 ， 我 们 只 用 最 简单 的 一 种 来 给 出 思想 。 图 16-16 展示 了 第 一 种 方法 。 


Alice Bob 
(要 求 者 ) 例 使 用 Alice-Bob 密 钥 进行 加 密 (证 明 者 ) 


R,: Bob 发 送 的 随机 数 





16-16 单 向 对 称 密 钥 验证 


第 一 个 消息 不 是 质询 - 响应 的 一 部 分 ， 他 只 告知 证 明 者 要 求 者 想 要 进行 质询 。 第 二 个 
消息 是 质询 。RB 是 证 明 者 (Bob) 为 了 质询 要 求 者 随便 挑选 的 随机 数 (一 定数 量 的 缩写 )。 要 
求 者 将 随机 数 通过 只 有 要 求 者 和 证 明 者 知道 的 秘密 共享 密 钥 进行 加 密 并 将 结果 发 送 给 证 明 者 。 
证 明 者 对 消息 进行 解密 ， 如 果 得 到 的 随机 数 和 证 明 者 发 送 的 相同 ，Alice 就 得 到 许可 进入 。 

注意 在 这 个 过 程 中 ， 要 求 者 和 证 明 者 需要 在 过 程 中 对 他 们 使 用 的 对 称 密 钥 保密 。 证 明 者 
也 必须 保存 给 要 求 者 进行 鉴别 的 随机 数值 直到 返回 响应 。 
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使 用 非 对 称 密 钥 密码 
图 16-17 展示 了 这 个 方法 。 我 们 可 以 使 用 非 对称 密 钥 密 码 代替 对 称 密 钥 密码 进行 实体 验 


证 。 在 这 里 秘密 必须 是 要 求 者 的 密 钥 。 要 求 者 必须 显示 她 拥有 的 私 钥 和 所 有 人 都 有 的 公 钥 相 
关 。 也 就 是 说 ， 证 明 者 必须 使 用 要 求 者 的 公 钥 对 质询 进行 加 密 ; 然后 要 求 者 使 用 她 的 私 钥 对 
消息 解密 ， 对 该 质询 的 响应 就 是 解密 后 的 消息 。 

Alice Bob 
(要 求 者 ) (证 明 者 ) 
_ 殴 使 用 Alice 的 公 钥 进行 加 密 : 
R,: Bob 发 送 的 随机 数 









图 16-17 单 向 非 对 称 密 钥 验证 


使 用 数字 签名 
实体 验证 也 可 以 通过 使 用 数字 签名 来 达到 。 当 数字 签名 用 在 实体 验证 时 ， 要 求 者 使 用 她 的 


私 钥 进行 签名 。 在 第 一 种 方法 中 ， 如 图 16-18 所 示 ，Bob 使 用 明文 质询 ， 然 后 Alice 签署 响应 。 


Alice Bob 
( 要求 者 ) (证 明 者 ) 
R,: Bob 发 送 的 随机 数 


/ | 
i 
使 用 Alice 的 私 钥 进 行 签 名 


图 16-18 单 向 数字 签名 验证 






16.3.5 ” 密 钥 管理 


我 们 在 前 几 节 讨论 了 对 称 密 钥 和 非 对 称 密 钥 密 码 术 。 然 而 我 们 还 没有 讨论 对 称 密 钥 密码 
术 中 的 密 钥 和 非 对 称 密 钥 密码 术 中 公 钥 是 如 何 分 配 和 维持 的 。 这 节 将 接触 这 两 个 问题 。 

1. 对 称 密 钥 分 发 

在 对 大 量 消息 进行 加 密 时 ， 对 称 密 钥 密 码 术 的 效率 比 非 对 称 密 钥 密码 术 要 高 ， 但 是 ， 对 
称 密 钥 密码 术 需 要 在 双方 间 共 享 密 钥 。 

如 果 Alice 需要 和 六 个 人 交换 机 密 性 消息 ， 她 需要 N 个 不 同 的 密 钥 。 如 果 和 个 人 需要 
互相 交流 呢 ? 如 果 我 们 要 求 每 两 个 人 都 使 用 两 个 密 钥 进行 双向 通信 ， 总 共 需 要 N(N-1) 个 密 
钥 。 如 果 我 们 允许 利用 同一 个 密 钥 进行 双向 通信 ， 只 需要 有 N(N-1)/2 个 密 钥 来 进行 对 称 密 
钥 通信 。 也 就 是 说 ， 如 果 100 万 人 需要 互相 通信 ， 每 个 人 几乎 要 有 100 万 个 不 同 的 密 钥 ; 总 
共 需 要 5 亿 个 密 钥 。 这 个 通常 称 为 N? 问题 ， 因 为 W 个 实体 需要 的 密 钥 总 数 接近 于 N?。 


委 会 





密 钥 的 数目 不 是 唯一 问题 ， 密 钥 的 分 发 是 另 一 个 问题 。 如 果 Alice 和 Bob 要 进行 通信 ， 
他 们 就 需要 一 种 方法 来 交换 密 钥 。 如 果 Alice 要 与 100 万 人 进行 通信 ， 她 如 何 能 与 100 万 人 
交换 密 钥 ? 使 用 因特网 肯定 不 是 一 个 安全 的 方法 。 很 显然 我 们 需要 一 种 有 效 的 方法 来 维护 和 
分 发 密 钥 。 

密 钥 分 发 中 心 (KDC ) 

一 个 实用 的 解决 方案 是 使 用 可 信 第 三 方 ， 称 为 密 钥 分 发 中 心 (KDC)。 为 了 减少 密 钥 的 
数量 ， 每 个 人 与 KDC 建立 一 个 共享 的 密 钥 。 一 个 密 钥 建立 在 KDC 和 每 个 成 员 间 。 现 在 的 
问题 是 Alice 如 何 向 Bob 发 送 机 密 消 息 。 过 程 如 下 : 

1 ) Alice 向 KDC 发 送 一 个 请 求 ， 说 明 她 需要 一 个 和 Bob 之 间 的 会 话 ( 临 时 的 ) 密 钥 。 

2 ) KDC 告诉 Bob 关于 Alice 的 请 求 。 

3 ) 如 果 Bob 同意 ， 一 个 会 话 密 钥 就 在 二 者 之 间 建 立 了 。 

密 钥 的 作用 是 为 了 使 Alice 和 Bob 在 KDC 得 到 验证 通过 ， 并 且 防 止 Eve 冒充 他 们 中 的 
任何 一 个 ， 这 里 的 密 钥 是 通过 KDC 建立 的 。 

多 个 密 钥 分 发 中 心 

当 使 用 同一 个 密 钥 分 发 中 心 的 人 数 增多 时 ， 系 统 会 变 得 难以 管理 并 导致 瓶颈 。 为 了 解 
决 这 个 问题 ， 我 们 可 以 拥有 多 个 密 钥 分 发 中 心 。 我 们 将 世界 划分 成 区 域 。 每 个 区 域 有 一 个 或 
多 个 KDC (备用 防止 KDC 故障 )。 现 在 如 果 Alice 想 发 机 密 消息 给 在 另外 一 个 区 域 的 Bob， 
Alice 和 该 区 的 KDC 联系 ， 随 后 和 Bob 所 在 区 域 的 KDC 联系 。 两 个 KDC 创造 在 Alice 和 
Bob 之 间 使 用 的 密 钥 。 这 些 可 能 是 本 地 KDC、 本 国 的 KDC 或 者 是 国际 KDC。 当 Alice 想 和 
居住 在 另 一 个 国家 的 Bob 联系 时 ， 她 将 她 的 请 求 发 给 本 地 KDC， 本 地 KDC 将 请 求 接替 至 
本 国 KDC， 本 国 的 KDC 将 请 求 接替 至 国际 KDC。 这 个 请 求 就 这 样 接替 发 送 至 Bob 住地 的 
本 地 KDC。 图 16-19 展示 了 一 个 分 级 多 个 KDC 的 布局 。 





图 16-19 多 个 KDC 


会 话 密 钥 

KDC 为 每 个 成 员 建 立 一 个 密 钥 ， 这 个 密 钥 只 可 以 在 成 员 和 KDC 之 间 使 用 ， 而 不 是 两 
个 成 员 之 间 。 如 果 Alice 需要 和 Bob 秘密 通信 ， 她 需要 一 个 在 她 和 Bob 之 间 的 秘密 密 钥 。 
KDC 可 以 建立 Alice 和 Bob 之 间 的 会 话 密 钥 ， 通 过 密 钥 和 中 心 会 话 。Alice 和 Bob 的 密 钥 是 
在 会 话 密 钥 建 立 前 用 来 授权 Alice 和 Bob 与 中 心 通信 和 互相 通信 的 。 当 通信 终止 后 ， 会 话 密 
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几 种 使 用 前 几 节 谈 到 的 思想 来 创建 会 话 密 钥 的 方法 已 经 提出 。 我 们 在 图 16-20 中 展示 了 
最 简单 的 方法 。 虽 然 这 个 方法 很 基础 ， 但 它 有 助 于 理解 文献 中 的 那些 更 复杂 的 方法 。 


K、 全 | 使 用 Alice-KDC 密 钥 进行 加 密 Alice 和 Bob 之 间 的 会 话 密 负 
K, 后 | 使 用 Bob-KDC 密 钥 进行 加 密 





图 16-20 用 KDC 创建 会 话 密 钥 


1 ) Alice 发 送 明 文 消息 到 KDC 来 得 到 她 和 Bob 之 间 的 对 称 会 话 密 钥 。 这 个 消息 包含 她 
的 注册 信息 (图 中 的 文字 Alice) 和 Bob 的 身份 (图 中 的 文字 Bob)。KDC 不 在 乎 这 个 消息 是 
不 加 密 公 开 的 。 

2 ) KDC 检索 接收 到 的 消息 创建 存根 ， 这 个 存根 使 用 Bob 的 密 钥 (KB ) 进行 加 密 ， 里 
面包 含 Alice 和 Bob 的 身份 和 会 话 密 钥 。 存 根 和 会 话 密 钥 的 副本 发 送 给 了 Alice。Alice 收 到 
消息 ， 解 密 并 提取 出 会 话 密 钥 。 她 无 法 解密 Bob 的 存根 ， 因 为 存根 是 给 Bob 的 而 不 是 她 的 。 
注意 ， 这 条 消息 使 用 了 双重 加 密 一 存根 是 加 密 的 ， 同 时 整 条 消息 也 是 加 密 的 。 在 第 二 条 信 
息 中 ，Alice 其 实 是 经 过 KDC 鉴别 的 ， 因 为 只 有 她 可 以 利用 她 和 KDC 之 间 的 密 钥 打开 整个 
消息 。 

3 ) Alice 将 存根 发 给 Bob，Bob 打开 存根 然后 得 知 Alice 需要 用 会 话 密 钥 给 他 发 送 消息 。 
注意 ， 在 这 个 消息 中 ，Bob 通过 了 KDC 鉴别 ， 因 为 只 有 他 可 以 打开 存根 。 因 为 Bob 通过 了 
KDC 的 鉴别 ， 所 以 Alice 信任 KDC 并 且 通 过 了 他 的 鉴别 。 同 样 的 道理 ，Alice 也 通过 了 Bob 
的 鉴别 ， 因 为 Bob 信任 KDC 而 且 KDC 将 含有 Alice 身份 的 存根 发 给 了 Bob。 

2. 公 钥 分 发 

在 非 对 称 密 钥 密码 术 中 ， 人 们 不 需要 一 个 对 称 的 共享 密 钥 。 如 果 Alice 想 要 给 Bob 发 
送 消 息 ， 她 只 要 知道 Bob 的 公 钥 ， 这 个 公 钥 是 对 公众 公开 的 ， 任 何人 都 可 以 使 用 的 。 如 果 
Bob 需要 向 Alice 发 送 一 消息 ， 他 也 只 需要 知道 Alice 的 公 钥 ， 这 个 公 钥 也 是 任何 人 都 知道 
的 。 在 公 钥 密码 术 中 ， 每 个 人 都 隐藏 私 钥 ， 公 开 公 和 钼 。 


在 公 铀 密码 术 中 ， 每 个 人 有 权 访问 每 个 人 的 公 铀 ， 公 铀 对 公众 可 用 


公 钥 像 密 钥 一 样 ， 也 需要 分 发 ， 这 样 才 有 用 。 让 我 们 简单 地 讨论 _ 下 公 铀 被 分 发 的 
方法 。 

公开 声明 

最 朴素 的 方法 是 公开 地 声明 公 钥 。Bob 可 以 把 他 的 公 钥 放 在 网 站 上 ， 或 在 地 方 或 国家 的 
报纸 上 发 表 声明 。 当 Alice 需要 给 Bob 发 送 一 条 机 密 消 息 时 ， 她 可 以 从 Bob 的 网 站 上 或 报 


RR 


纸 上 得 到 Bob 的 公 钥 ， 或 者 甚至 她 可 以 发 送 一 条 消息 请 求 该 公 钥 。 但 是 ， 这 种 方法 不 安全 ， 
它 可 能 被 伪造 。 例 如 ，Eve 可 能 作 了 这 个 的 公开 声明 ， 在 Bob 有 行动 之 前 ， 损 坏 可 能 已 经 造 
成 。Eve 可 以 恩 弄 Alice， 让 Alice 发 给 她 一 条 本 来 要 发 送 给 Bob 的 消息 。Eve 也 可 以 用 相应 
的 伪造 的 私 钥 签署 一 个 文档 ， 使 所 有 人 相信 这 是 Bob 签署 的 。 如 果 Alice 直接 向 Bob 请 求 公 
钥 ， 这 种 方法 也 是 脆弱 的 。Eve 可 以 截获 Bob 的 回应 ， 用 她 自己 伪造 的 公 钥 来 替换 Bob 的 
公 钥 。 

认证 机 构 

最 常用 的 分 发 公 钥 的 方法 是 建立 公 钥 认证 。Bob 想 要 两 件 事情 : 他 想 要 人 们 知道 他 的 公 
钥 ， 他 想 要 没有 人 接受 假冒 他 的 公 钥 。Bob 可 以 去 认证 机 构 ( CA)， 它 是 一 个 把 公 钥 和 实体 
捆绑 在 一 起 并 处 理 认 证 的 政府 机 构 。 图 16-21 展示 了 这 个 概念 。 


对” 
CA 
' Bob 的 公 和 钥 





分 发 给 公众 ---- 


图 16-21 认证 机 构 


CA 本 身 有 一 把 众所周知 的 公 钥 ， 这 把 公 钥 不 能 伪造 。CA 先 检查 Bob 的 身份 ， 比 如 通 
过 一 张 带 照片 的 身份 证 和 其 他 一 些 证 据 。 然 后 ，CA 向 Bob 要 公 钥 ， 并 把 它 写 在 证 书 上 。 为 
了 防止 证 书本 身 被 伪造 ，CA 用 它 的 私 钥 签署 证 书 。 现 在 Bob 可 以 上 载 签署 的 证 书 。 任 何 需 
要 Bob 公 钥 的 人 就 可 以 下 载 签 署 的 证 书 ， 并 使 用 中 心 的 公 钥 来 抽取 出 Bob 的 公 钥 。 

X.509 

虽然 CA 的 使 用 可 以 解决 公 钥 骗 局 的 问题 ， 它 也 产生 了 副作用 。 每 个 证 书 的 格式 可 能 都 
不 一 样 ， 如 果 Alice 想 利 用 程序 来 自动 下 载 不 同 的 证 书 和 不 同人 的 消息 摘要 ， 这 个 程序 不 一 
定 能 做 到 。 一 个 证 书 的 公 钥 可 能 是 这 个 格式 的 而 另 一 个 证 书 的 公 钥 格式 可 能 又 不 一 样 ， 存 放 
公 钥 的 位 置 可 能 在 这 个 证 书 里 是 第 一 行 ， 而 在 另外 一 个 证 书 里 却 是 第 三 行 。 普 遍 的 使 用 必须 
依赖 通用 的 格式 ， 为 了 消除 这 个 副作用 ，ITU 设计 了 X.509， 一 个 在 经 历 部 分 修改 后 被 因 特 
网 广泛 接受 的 建议 。X.509 是 一 个 结构 化 描述 证 书 的 方式 。 它 使 用 叫 作 ASN.1 (在 第 9 章 中 
提 过 ) 的 一 个 众所周知 的 协议 ， 这 个 协议 定义 了 计算 机 编程 者 很 熟悉 的 一 些 领域 。 


16.4 防火 墙 

前 面 这 些 安全 测试 都 无 法 防止 Eve 向 系统 发 送 有 害 信 息 。 我 们 需要 防火 墙 来 控制 对 系 
统 的 访问 。 防 火 墙 是 一 个 安装 在 组 织 的 内 部 网 络 和 因特网 其 他 部 分 之 间 的 设备 (通常 是 一 个 
路 由 器 或 计算 机 )。 防 火 墙 是 为 了 推进 一 些 数据 包 而 过 滤 其 他 数据 包 所 设计 的 。 图 16-22 展 


示 了 一 个 防火 墙 。 
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例如 ， 防 火 墙 可 能 会 过 滤 所 有 到 来 的 目标 为 特定 主机 或 服务 器 (例如 HTTP) 的 数据 包 。 
防火 墙 也 可 以 用 来 阻拦 对 组 织 内 特定 主机 或 服务 的 访问 。 防 火 墙 通常 分 为 包 过 滤 防 火 墙 和 代 


理 防 火 墙 。 





图 16-22 防火墙 


16.4.1 包 过 滤 防 火 墙 
防火 墙 可 以 用 作 数 据 包 过 滤器 。 它 可 以 基于 网 络 层 的 信息 和 传输 层 的 头 部 : 源 和 目标 


IP 地 址 ， 源 和 目标 端口 地 址 以 及 协议 的 种 类 (TCP 或 UDP) 来 推进 或 阻拦 数据 包 。 包 过 滤 
防火 墙 是 一 个 使 用 过 滤 表 单 决定 哪些 数据 包 应 应 该 丢弃 (不 推进 ) 的 路 由 器 。 图 16-23 展示 了 


这 类 防火 墙 的 过 滤 表 格 示 例 。 
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图 16-23 包 过 滤 防 火 墙 


根据 图 ， 以 下 数据 包 被 过 滤 : 
1 ) 来 自 网 络 131.34.0.0 的 数据 包 被 阻拦 了 (安全 预防 措施 )。 注 意 * 号 代表 “任何 ”。 


2 ) 终点 为 任何 国际 TELNET 服务 器 (端口 23 ) 的 外 发 数据 包 被 阻拦 了 。 
3 ) 到 来 的 目标 为 内 部 主机 194.78.20.8 的 数据 包 被 阻拦 了 ， 该 组 织 希 望 这 个 主机 只 用 于 


内 部 使 用 。 
4 ) 终点 为 HTTP 服务 器 (端口 80 ) 的 外 发 数据 包 被 阻拦 了 ， 该 组 织 不 希望 雇员 浏览 因 


特 网 。 


-| 


16.4.2 ”代理 防火 墙 


包 过 滤 防 火 墙 是 基于 网 络 层 的 有 效 信息 和 传输 层 头 部 (IP 和 TCP/UDP) 建立 的 。 然 而 ， 
有 时 我 们 也 需要 基于 消息 自身 携带 的 信息 (应 用 层 上 ) 进行 过 滤 。 比 如 ,假设 一 个 组 织 想 对 
其 网 页 试 试 以 下 几 条 政策 : 只 有 那些 之 前 与 本 公司 建立 商业 联系 的 因特网 用 户 可 以 访问 ; 其 
他 用 户 必 须 阻 拦 。 这 个 情况 下 ， 数 据 包 过 滤 防 火 墙 就 不 可 行 ， 因 为 它 无 法 区 分 到 达 TCP 端 
口 80 (HTTP) 的 不 同 数据 包 ， 必 须 在 应 用 层 (通过 URL) 进行 测试 。 

一 个 解决 措施 是 安装 代理 计算 机 (有 时 也 称 为 应 用 网 关 )， 代 理 计算 机 位 于 客户 计算 机 
和 公司 计算 机 之 间 。 当 用 户 客户 进程 发 送 消息 时 ， 应 用 网 关 运 行 服务 器 进程 来 接收 请 求 。 服 
务 器 在 应 用 层 打 开 数 据 包 并 且 查 找 这 个 请 求 是 否 合法 。 如 果 是 ， 那 么 服务 器 运行 客户 端 进程 
并 将 消息 发 给 公司 中 真正 的 服务 器 ， 否 则 这 个 消息 会 被 丢弃 并 且 错 误 消 息 会 发 给 外 部 用 户 。 
通过 这 个 方法 ， 外 部 用 户 的 请 求 基 于 内 容 在 应 用 层 进行 筛选 。 图 16-24 展示 了 HTTP 的 一 个 


应 用 网 关 的 实现 。 





图 16-24 ”代理 防火 墙 


16.5 ” 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
e。 Bishop, M. Computer Security, Reading, MA: Addison-Wesley, 2002 


es。 Forouzan, B. Cryptography and Network Security, New York: McGraw-Hill, 2007 
。 Kaufman, C., Petlman, R. and Speciner, M. Network Security, Upper Saddle River, 


NJ:Prentice-Hall, 2002 
® Stallings, W. Cryptography and Network Security, Upper Saddle River, NJ: Prentice- 


Hall, 2006 
关键 术语 
additive cipher ( 加 法 密码 ) availability ( 可 用 性 ) 
application gateway ( 应 用 网 关 ) block cipher ( 分 组 密码 ) 


asymmetric-key cipher ( 非 对 称 密 钥 密 码 术 ) caesar cipher ( 恺 撤 密码 ) 
autokey cipher ( 自动 密 钥 密 码 ) certification authority ( CA， 认 证 机 构 ) 
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challenge-response authentication ( 质询 - 响 
应 认证 ) 

cipher ( 密码 ) 

ciphertext ( 密 文 ) 

confidentiality ( 机 密 性 ) 

cryptographic hash function ( 密码 散 列 函数 ) 

cryptography ( 密码 学 ) 

decryption ( 解密 ) 

decryption algorithm ( 解密 算法 ) 

denial of service (DoS ， 拒 绝 服 务 ) 

digest (摘要 ) 

digital signature ( 数字 签名 ) 

encryption ( 加 密 ) 

encryption algorithm ( 加密 算法 ) 

firewall ( 防火 墙 ) 

hashed MAC ( HMAC， 散 列 MAC ) 

integrity (完整 性 ) 

key ( 密 钥 ) 

key-distribution center ( KDC, 密 钥 分 发 中 心 ) 

masquerading ( 伪装 ) 

message authentication code (MAC， 消 息 验 
证 码 ) 

message digest (MD ， 消 息 摘要 ) 

monoalphabetic cipher ( 单字 母 密码 ) 

one-time pad (一 次 一 密 乱 码 ) 

packet-filter firewall ( 包 过 滤 防 火 墙 ) 

plaintext ( 明文 ) 


小 结 


polyalphabetic cipher ( 多 字母 密码 ) 

port address ( 端口 地 址 ) 

private key( 私 钥 ) 

proxy firewall ( 代理 防火 墙 ) 

public key( 公 钥 ) 

public-key certificate ( 公 钥 证 书 ) 
replaying ( 重 放 ) 

RSA cryptosystem (RSA 密码 系统 ) 
secret key ( 秘密 密 钥 ) 

Secure Hash Algorithm ( SHA ， 安 全 散 列 算法 ) 
security attack ( 安全 攻击 ) 

security goal ( 安全 目标 ) 

shift cipher ( 移 位 密码 ) 

side effect ( 副作用 ) 

snooping ( 嗅 探 ) 

spoofing ( 欺骗 ) 

steganography ( 隐 写 术 ) 

stream cipher ( 流 密码 ) 

substitution cipher ( 替换 密码 ) 
symmetric-key cipher ( 对 称 密 钥 密码 术 ) 
symmetric-key encryption ( 对 称 密 钥 加 密 ) 
ticket ( 存根 ) 

traffic analysis ( 流量 分 析 ) 

transposition cipher ( 置换 密码 ) 
verifying algorithm ( 验证 算法 ) 

X.509 


。 我 们 提 到 三 个 安全 目标 : 机 密 性 、 完 整 性 和 可 用 性 。 我 们 把 对 安全 的 攻击 分 成 三 大 
类 : 威胁 机 密 性 的 攻击 、 威 胁 完整 性 的 攻击 和 威胁 可 用 性 的 攻击 。 为 了 取得 安全 目标 
和 防止 相应 的 攻击 ，ITU-U (international telecommunication union ) 定义 了 下 列 服务 : 
数据 机 密 性 、 数 据 完 整 性 、 身 份 验证 、 不 可 抵赖 和 访问 控制 。 两 种 技术 被 用 来 提供 这 


些 服务 : 密码 术 和 隐 写 术 。 


。 对 称 窗 钥 密码 术 使 用 一 个 密码 进行 加 密 和 人 解密。Alice 和 Bob 首先 要 认可 一 个 共享 的 
秘密 ， 这 个 秘密 构成 了 他 们 的 密 钥 。 为 了 发 信息 给 Bob，Alice 使 用 密 钥 加 密 信息 ; 
为 了 发 信息 给 Alice，Bob 使 用 相同 的 密 钥 加 密 信息 。 传 统 对 称 密 钥 密码 是 面向 字符 
的 ， 使 用 两 种 技术 向 人 侵 者 隐藏 信息 : 替换 和 置换 。 

。 现代 对 称 密 钥 密码 面向 二 进 制 位 ， 使 用 非常 复杂 的 算法 来 加 密 和 解密 二 进 制 位 块 。 非 
对 称 密 钥 密 码 术 使 用 两 个 不 同 的 密 钥 : 私 钥 和 公 钥 。Bob 首先 创建 一 对 密 钥 ， 然 后 保 
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存 私 钥 ， 声 明 公 和 钥 。 如 果 有 人 需要 给 Bob 发 送信 息 ， 那 他 就 可 以 使 用 Bob 的 公 钥 进 
行 加 密 ， 为 了 阅读 信息 ，Bob 使 用 他 的 私 钥 解 密 信 息 。 

完整 性 就 是 保护 信息 ， 免 受 纂 改 。 为 了 保存 信息 的 完整 性 ， 信 息 要 经 过 一 个 称 为 密码 
散 列 函数 的 算法 。 这 个 函数 创建 了 信息 的 压缩 影像 ， 称 为 信息 摘要 。 信 息 验证 代码 


( MAC) 用 来 提供 信息 验证 。MAC 包含 发 送 者 和 接收 者 共享 的 秘密 。 数 字 签 名 是 电 


子 地 签署 文档 的 过 程 。 它 提供 信息 完整 性 、 信 息 验证 和 不 可 抵赖 。 实 体验 证 是 一 种 用 
来 让 一 方 证 明 另 一 方 身份 的 技术 。 实 体 身份 验证 使 用 三 类 验证 ， 所 知道 的 、 所 拥有 的 
和 所 固有 的 。 我 们 提 到 了 4 种 验证 技术 : 基于 密码 的 、 质 询 - 响应 、 零 知识 和 生物 测 
定 法 。 


。 对 于 对 称 密 钥 或 非 对称 密 钥 密码 术 ， 双 方 都 需要 交换 密 钥 。 密 钥 管理 方法 允许 我 们 去 


交换 密 钥 ， 而 不 需要 面对面 地 密 钥 交换 。 在 对 称 密 钥 密 码 术 中 ， 实 用 的 解决 方案 是 使 
用 密 钥 分 发 中 心 (KDC)。 在 非 对 称 密 钥 密码 术 中 ， 实 用 的 解决 方案 是 使 用 由 认证 机 
构 (CA) 认证 的 证 书 。 


16.6 练习 
小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建 议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 
复习 题 
Q16-1 以 下 哪 种 攻击 对 机 密 性 有 威胁 ? 
a. 嗅 探 b. 伪装 c. 抵 匮 
Q16-2 ”以 下 哪 种 攻击 对 完整 性 有 威胁 ? 
a. 算 改 b. 重复 c, 拒绝 服务 
Q16-3 ”以 下 哪 种 攻击 对 可 用 性 有 威胁 ? 
a. 抵赖 b. 拒绝 服务 ? c. 算 改 
Q16-4 ”以 下 哪个 词汇 意思 是 “秘密 书写 ”， 哪 个 是 “掩饰 书写 ”7? 
a. 密码 术 b. 隐 写 术 


Q16-5 


Q16-6， 


Q16-7 


Q16-8 


Q16-9 


当 密 封 的 信件 从 Alice 发 给 Bob 时 ， 这 是 一 个 使 用 密码 术 或 隐 写 术 来 保障 机 密 性 的 例子 吗 ? 

从 Alice 发 给 Bob 的 信件 使 用 只 有 这 两 人 理解 的 语言 写成 ， 这 是 一 个 使 用 密码 术 或 隐 写 术 的 
例子 吗 ? 

Alice 找到 一 个 秘密 写 给 Bob 的 方法 。 每 次 她 都 用 一 个 新 的 文本 ， 比 如 报纸 上 的 一 篇 文章 ， 但 
会 在 单词 之 间 插 入 1 或 2 个 空格 ， 单 空格 表示 二 进 制 0， 双 空格 表示 二 进 制 1。Bob 抽取 这 些 
二 进 制 数码 ， 并 用 ASCII 码 译 解 。 这 是 一 个 使 用 密码 术 或 隐 写 术 的 例子 吗 ? 请 说 明 。 

Alice 和 Bob 互相 交换 机 密 信息 。 他 们 共享 一 个 非常 大 的 数字 作为 双向 的 加 密 和 解密 密 钥 。 这 
是 一 个 使 用 对 称 密 钥 或 非 对 称 密 钥 密码 术 的 例子 吗 ? 请 说 明 。 

Alice 加 密 信息 发 送 给 Bob 以 及 解密 收 到 Bob 的 信息 都 使 用 了 同样 的 密 钥 。 这 是 一 个 使 用 对 
称 密 钥 或 非 对 称 密 钥 密码 术 的 例子 吗 ? 厂 阅 明 。 


Q16-10 ”区 分 替换 密码 和 置换 密码 。 


Q16-11 


在 密码 中 ， 所 有 明文 中 的 A 变化 成 密 文中 的 D 并 且 所 有 明文 中 的 D 变化 成 密 文中 的 了 H。 这 
是 一 个 单字 母 或 多 字母 的 替换 密码 吗 ? 请 说 明 。 
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Q16-12 


Q16-13 


Q16-14 


Q16-15 


Q16-16 
Q16-17 
Q16-18 


Q16-19 
Q16-20 
Q16-21 
Q16-22 


Q16-23 


Q16-24 
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单字 母 或 多 字母 密码 ， 哪 个 更 容易 破解 ? 

假设 Alice 和 Bob 使 用 模 26 的 加 法 密码 算法 。 人 侵 者 Eve 要 通过 尝试 所 有 可 能 的 密 钥 来 破 
解 ( 蛮 力 攻 击 )， 她 要 平均 尝试 多 少 个 密 钥 ? 

假设 我 们 有 一 个 1000 字符 的 纯 文本 。 按 照 下 列 密码 ， 各 需要 多 少 密 钥 来 加 密 或 解密 这 些 
信息 ? 

a, 加 法 密码 b. 单字 母 密码 c. 自动 密 钥 密码 

根据 流 和 密码 块 的 定义 ， 找 出 下 列 密码 哪个 是 流 密码 ? 

a. 加 法 密码 b. 单字 母 密码 c, 自动 密 钥 密 码 

如 果 一 次 一 密 乱 码 (如 图 16-7 所 示 ) 是 最 简单 和 最 安全 的 密码 ， 为 什么 不 一 直 使 用 ? 

为 什么 你 认为 非 对 称 密 钥 密码 术 只 用 于 少量 信息 ? 

在 一 个 非 对 称 密 钥 密 码 中 ， 哪 个 密 钥 用 于 加 密 ， 哪 个 密 钥 用 于 解密 ? 

a, 公 钠 b. 私 钥 

在 RSA 密码 中 ， 为 什么 Bob 不 能 选择 1 作为 公 铀 e ? 

如 图 16-12 所 示 ， 加 入 散 列 函数 中 的 密 钥 (MAC ) 扮演 了 什么 角色 ? 请 说 明 。 

区 别 信息 验证 和 实体 验证 。 

Alice 为 她 发 送 给 Bob 的 信息 签名 以 证 明 她 是 该 信息 的 发 送 者 。Alice 需要 使 用 以 下 哪个 
密 铀 ? 

a. Alice 的 公 舱 b. Alice 的 私 钥 

Alice 需要 给 50 人 的 组 群发 信息 。 如 果 Alice 需要 使 用 信息 验证 ， 你 推荐 以 下 哪 种 方式 : 

a. MAC b. 数字 签名 

数字 签名 不 支持 以 下 哪 种 服务 ? 


a. 信息 验证 b. 机 密 性 c. 不 可 抵赖 性 


练习 题 


P16-1 


P16-2 
P16-3 


P16-4 


P16-5 


定义 以 下 案例 的 攻击 种 类 

a. 一 个 学 生 破 墙 而 人 ， 进 入 教授 办 公 室 ， 获 得 下 次 考试 的 副本 。 

b. 一 个 学 生 用 $10 支票 购买 一 本 旧书 ， 后 来 发 现 该 支票 结算 了 $100 现金 。 

c. 一 个 学 生 用 伪造 的 电子 邮件 回复 地 址 每 天 给 学 校 发 送 数 百 份 邮件 。 

使 用 密 钥 为 10 的 加 法 密码 加 密 明 文 “book”， 然 后 解密 消息 ， 得 到 原始 明文 。 

使 用 密 钥 为 20 的 加 法 密码 加 密 明 文 “this is an exercise"”， 忽 略 单词 间 的 空格 。 然 后 解密 消息 ， 
得 到 原始 明文 。 

Atbash 是 在 圣经 撰写 者 中 流行 的 密码 。 在 Atbash 中 ，'A' 密 写 为 'Z'，'B' 密 写 为 'Y'， 以 此 类 
推 。 同 样 ，'Z' 密 写 为 'A'，'Y' 密 写 为 'B'， 以 此 类 推 。 假 设 字母 表 一 分 为 二 ， 前 半 字 母 表 中 的 
字母 密 写 为 后 半 字 母 表 的 字母 ， 反 之 亦 然 。 找 出 加 密 类 型 和 密 钥 。 使 用 Atbash 加 密 法 加 密 明 
文 “an exercise” 。 

替换 密码 不 必 是 字符 到 字符 的 转换 。 在 棋盘 密码 中 ， 明 文中 的 每 个 字母 密 写 为 2 个 整数 。 密 
钥 是 一 个 5 x 5 字符 矩阵 。 明 文 是 矩阵 中 的 字符 ， 密 文 是 行列 对 应 的 2 个 整数 (在 1 一 5 之 间 )。 
使 用 棋盘 加 密 法 的 以 下 密 钥 加密 明 文 “An exercise”。 
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P16-6 


P16-7 


P16-8 


P16-9 


Alice 在 她 的 计算 机 上 只 用 加 法 加 密 向 她 的 朋友 发 送 消 息 。 她 认为 如 果 她 把 消息 加 密 2 次 就 更 

安全 ， 每 次 使 用 一 个 不 同 的 密 钥 。 她 对 吗 ? 给 出 你 的 解答 。 

有 一 种 攻击 称 为 密 文 攻击 ， 人 侵 者 可 以 使 用 类 似 加 法 加 密 的 简单 加 密 法 。 在 这 种 类 型 的 攻 

击 中 ， 入 侵 者 破解 加 密 ， 试 图 找到 密 钥 ， 最 终 获 得 明文 。 用 于 攻击 密 文 的 方法 之 一 是 蛮 

力 方 法 ， 入 侵 者 尝试 多 种 密 钥 不 断 破解 消息 ， 直 到 消息 有 意义 为 止 。 假设 入 侵 者 有 密 文 

“UVACLYZLJBYL"， 他 使 用 从 1 开始 的 密 钥 尝试 破解 ， 直 到 出 现 有 意义 的 文字 。 

在 移 位 加 密 中 ， 加 密 和 解密 密 钥 通常 出 现在 二 维 表格 (数组 ) 中 ， 加 密 算法 由 一 段 软件 (程序 ) 

实现 。 

a. 显示 图 16-5 中 加 密 密 钥 的 数组 。 提 示 : 每 个 元 素 的 值 可 以 表示 为 输入 列 数字 ， 索 引 可 表示 
为 输出 列 数字 。 

b. 显示 图 16-5 中 解密 密 钥 的 数组 。 

c. 解释 ， 给 出 加 密 密 钥 ， 我 们 如 何 能 找到 解密 密 钥 。 

假设 Bob 使 用 RSA 密码 系统 ， 选 择 p= 11，g = 13，d = 7， 下 列 哪 个 是 公 钥 e 的 值 ? 

a.1l b.103 c.19 


P16-10 在 RSA 密码 系统 中 ,给 出 p= 107, 9 = 113，e = 13，d = 3653 ， 使 用 00-26 编码 表 ( 00 是 


字母 A，26 是 空格 符 ) 加 密 消息 “THIS IS TOUGH"”。 解 密 密 文 ， 获 得 原始 消息 。 


P16-11 解释 为 什么 公私 钥 不 能 用 于 创建 MAC。 
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计算 理论 





在 第 1 一 16 章 中 ， 我 们 把 计算 机 看 成 一 台 问 题 求解 机 器 。 在 这 一 章 中 ,我 们 回答 一 些 诸 
如 此 类 的 问题 : 哪些 问题 可 以 通过 计算 机 解决 ? 语言 之 间 是 否 存在 优 劣 ? 运行 一 个 程序 前 ， 
是 否 可 以 确定 该 程序 将 要 停止 (终止 ) 还 是 一 直 运 行 ? 用 一 种 特定 的 语言 解决 一 个 问题 需要 
多 长 时 间 ? 为 了 回答 这 些 问题 ， 我 们 求助 于 一 门 学 科 : 计算 理论 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 描述 我 们 称 为 简单 语言 的 编程 语言 ， 并 定义 它 的 基本 语句 ; 

。 在 简单 语言 中 ， 使 用 简单 语言 的 复合 写 出 宏 ; 

。 描述 作为 计算 机 模型 的 图 灵机 的 构成 ; 

。 使 用 图 灵机 ， 显 示 简 单 语言 中 的 简单 语句 是 如 何 被 模拟 的 ; 

。 理解 邱 奇 - 图 灵 理 论 和 它 的 含义 ; 

。 定义 歌德 尔 数 和 它 的 应 用 ; 

。 理解 停机 问题 的 概念 和 问题 不 可 解 是 如 何 被 证 明 的 ; 

。 区 分 可 解 和 不 可 解 问题 ; 

。 区 分 多 项 式 和 非 多 项 式 可 解 问题 。 


17.1 简单 语言 


我 们 可 以 仅 用 三 条 语句 来 定义 一 种 语言 ， 它 们 
是 : 递增 语句 、 递 减 语 名 和 循环 语句 (图 17-1 )。 在 
该 语言 中 ， 只 能 使 用 非 负 整 数 数据 类 型 。 这 里 不 需 
要 其 他 类 型 数据 ， 因 为 本 章 的 目标 仅仅 是 说 明 计算 
理论 中 的 一 些 思想 。 该 语言 只 使 用 少数 的 几 个 符号 ， 图 17-1 简单 语言 中 的 语句 
"和 
17.1.1 递增 语句 


递增 语句 对 变量 加 1。 其 格式 显示 在 算法 17.1 中 。 
算法 17.1 递增 语句 





incr (XI) 


17.1.2 ”递减 语句 
递减 语句 从 变量 中 减 1。 其 格式 显示 在 算法 17.2 中 。 
算法 17.2 ”递减 语句 


decr (X) 


落 划 理论 





17.1.3 ”循环 语句 
循环 语句 是 在 变量 的 值 不 为 0 时， 重复 进行 一 个 动作 (或 一 系列 动作 )。 其 格式 显示 在 
算法 17.3 中 。 
算法 17.3 ”循环 语句 


while (X) 
{ 

decr (X) 

Body of the loop 
) 


“17.1.4 简单 语言 的 威力 


归纳 来 说 ， 可 以 证 明 只 使 用 这 三 种 语句 的 简单 程序 设计 语言 和 我 们 现在 使 用 的 任何 一 种 
复杂 语言 (比如 C) 一 样 强大 (虽然 从 效率 来 说 不 一 定 )。 为 了 证 明 这 一 点 ， 可 以 演示 一 下 如 
何 模拟 当今 流行 语言 中 的 某 些 语句 。 

1. 简单 语言 中 的 宏 

我 们 把 每 次 模拟 称 为 一 个 宏 ， 并 且 在 其 他 模拟 中 使 用 时 不 需要 再 重复 其 代码 。 一 个 宏 
(macro，macroinstruction 的 简称 ) 是 高 级 语言 中 的 一 条 指令 ， 它 等 价 于 相同 语言 中 的 一 条 或 


多 条 指令 的 特定 集合 
第 一 个 宏 : x--0 
算法 17.4 给 出 了 如 何 用 简单 语言 的 语句 来 给 一 变量 X 赋值 为 0。 有 时 叫 作 清空 变量 。 
算法 17.4” 宏 X*0 
while (X) 
{ 
decr (X) 
} 
第 二 个 宏 : 和 -一 aa 


算法 17.5 给 出 了 如 何 用 简单 语言 的 语句 将 一 正 整数 赋值 给 变量 X。 首 先 清空 变量 X， 

然后 对 4 递增 n 次 。 
算法 17.5 宏 X 一 n 

X40 

incr (X) 

incr (X) 

tei 

// incr (X) 语 名 表明 重 怎 n 次 

第 三 个 宏 : YX 

算法 17.6 模拟 了 简单 语言 中 的 宏 Y< 一 X， 注 意 我 们 可 以 用 额外 的 代码 行 来 恢复 X 的 值 。 


算法 17.6 宏 Y 一 XX 


Y*—0 
while (X) 
{ 
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decr (X) 
incr (Y) 
} 


第 四 个 宏 : Y 一 Y+X 
算法 17.7 模拟 了 简单 语言 中 的 宏 Y 一 Y+X， 我 们 同样 可 以 用 额外 的 代码 行 来 恢复 X 的 


值 ， 使 其 恢复 为 原始 的 值 。 
算法 17.7 宏 Y 一 Y+X 


while (X) 
{ 
decr (X) 
incr (Y) 
) 


第 五 个 宏 : Y~ 一 YXX 

算法 17.8 模拟 了 简单 语言 中 的 安 Y 一 YXX。 我 们 可 以 使 用 加 法 宏 ， 因 为 整数 的 乘法 可 
以 用 重复 的 加 法 来 模拟 。 注 意 ， 我 们 需要 把 X 的 值 保存 在 一 个 临时 变量 中 ， 因 为 在 每 次 的 
加 法 中 ， 我 们 需要 把 X 的 原始 值 加 到 YY 上。 


算法 17.8 宏 Y -一 YXX 

TEMP+4 一 Y 
Y4 一 0 
while (X) 
( | 

decr (X) 

Y4 一 Y+TEMP 
) 

第 六 个 宏 ; YY 

算法 17.9 模拟 了 简单 语言 中 的 宏 Y 一 Y<。 我 们 使 用 乘法 宏 来 完成 它 ， 因 为 整数 的 指数 
可 以 用 重复 的 乘法 来 模拟 。 


算法 17.9 宏 Y 一 Y* 


TEMP+4 一 Y 
3 
while (X) 
{ 
decr (XI) 
Y*— Y xX 人 TEMP 
) 


第 七 个 宏 ; if X then A 
算法 17.10 模拟 了 简单 语言 中 的 第 七 个 宏 ， 这 个 宏 模拟 了 现代 语言 中 的 判断 语句 (if)。 
在 这 个 宏 中 ， 变 量 X 的 值 只 能 是 0 或 1 这 两 个 值 之 间 的 一 个 。 如 果 X 的 值 不 是 0， 在 循环 
中 A (一 个 动作 或 一 系列 动作 ) 被 执行 。 但 是 该 循环 只 执行 一 次 ， 因 为 第 一 轮 执行 完毕 后 X 
的 值 变 成 0， 从 而 跳出 循环 。 如 果 X 的 值 是 0， 循 环 被 跳 过 。 
算法 17.10 宏 ifXthenA 





while (X) 
{ 
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decr (X) 
A 
} 


其 他 宏 
很 显然 ,我们 需要 更 多 的 宏 来 使 简单 语言 与 现代 语言 相 匹 配 。 建 立 其 他 宏 是 可 能 的 , 但 
却 并 不 简单 。 


2. 输入 和 输出 
在 简单 语言 中 ，read X 语句 可 以 使 用 (Xn) 来 模拟 ， 我 们 也 可 模拟 输出 ， 即 假定 程序 


中 使 用 的 最 后 一 个 变量 保存 着 将 要 打印 的 数据 。 记 住 这 不 是 实际 的 语言 ， 而 是 仅仅 用 来 证 明 
计算 机 科学 中 的 一 些 定 理 。 


17.2 图 灵机 
图 灵机 是 在 1936 年 由 Alan M. Turing 提出 用 来 解决 可 计算 问题 的 。 它 是 现代 计算 机 的 
基础 。 在 本 章 中 我 们 将 用 图 灵机 的 一 个 非常 简单 的 版 本 来 说 明 它 是 如 何 工作 的 。 


17.2.1 图 灵机 组 成 部 件 


图 灵机 由 三 部 分 组 成 : 磁带 、 控 制 器 和 
读 / 写 头 (如 图 17-2 所 示 )。 

1. 磁带 

尽管 现代 计算 机 中 使 用 的 随机 存储 设备 
容量 是 有 限 的 ， 但 我 们 假定 图 灵机 中 的 内 存 “二 
是 无 限 的 。 磁 带 任何 时 候 只 能 保存 一 系列 顺 
序 字 符 ， 该 字符 来 自 计算 机 所 能 接收 的 字符 
集中 。 为 了 我 们 的 目的 ， 假 设 图 灵机 上 只 能 接收 两 个 符号 : 空白 (b) 和 数字 1。 图 17-3 给 出 
了 这 种 机 器 磁带 记录 数据 的 一 个 例子 。 

左手 的 空白 定义 了 存储 在 磁带 上 的 非 负 整数 的 开始 ， 一 个 整数 用 1 构成 的 串 表 示 。 右 手 
的 空白 定义 了 整数 的 结束 。 磁 带 的 其 他 部 分 包含 了 空白 字符 。 如 磁带 上 存 有 多 个 整数 ， 它 们 
用 至 少 一 个 空白 字符 隔 开 。 

此 外 ， 还 假设 磁带 处 理 一 元 算术 中 的 正 
整数 。 在 一 元 算术 中 ， 正 整数 仅 由 1 组 成 。 
例如 ， 整 数 4 表示 为 1111 (4 个 1)， 7 表示 
为 1111111 (7 个 1), 没有 1 的 地 方 表示 0。 SO 

2. 读 / 写 头 

读 / 写 头 任何 时 刻 总 是 指向 磁带 上 的 一 个 符号 ， 我 们 称 这 个 符号 为 当前 符号 ， 读 / 写 头 
每 次 在 磁带 上 读 写 一 个 符号 。 每 读 写 完 一 次 后 ， 它 向 左 移 、 向 右 移 。 读 、 写 和 移动 都 是 在 控 
制 器 指令 下 进行 的 。 

3. 控制 器 

控制 器 是 理论 上 功能 作用 类 似 于 现代 计算 机 中 央 处 理 单元 (CPU) 的 一 个 部 件 ， 它 是 一 
个 有 限 状态 自动 机 ， 即 该 机 器 有 预定 的 有 限 个 状态 并 能 根据 输入 从 一 个 状态 转移 到 另 一 个 状 
态 ， 但 任何 时 候 它 只 能 处 于 这 些 状 态 中 的 一 种 。 
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图 17-4 给 出 了 简单 控制 器 作为 有 限 状态 自动 机 控制 器 的 状态 转移 图 。 在 这 个 图 中 ， 目 
动机 有 三 个 状态 (A、B 和 C)， 虽 然 控 制 器 通常 有 很 多 状态 。 图 中 给 出 了 读 人 字符 后 所 引起 
状态 的 改变 。 每 一 行 上 的 表达 式 (x/y/L、x/y/R 和 x/y/N) 显示 了 : 控制 器 读 人 x 后 ， 它 写 符 
号 y (改写 x)， 并 将 读 / 写 头 移 到 左边 (L)、 右 边 (R) 或 不 动 (N)。 注 意 既 然 磁 带 上 的 符号 
只 有 空白 或 数字 1， 那 么 从 每 个 状态 出 去 的 路 径 只 有 两 条 : 要 么 读 到 的 是 空白 符号 ， 要么 读 
到 的 是 数字 1。 线 ( 称 为 转移 线 ) 的 起 点 显示 的 是 当前 状态 ， 线 的 末端 (箭头 ) 显示 的 是 接 


下 来 状态 。 


x/y/R;: 如 果 读 入 了 x， 写 入 y 并 移 到 右边 
x/y/L:， 如 果 读 入 了 x， 写 入 y 并 移 到 左边 
x/y/N: 如 果 读 入 了 x， 写 入 y 但 不 移动 





17-4 图 灵机 中 的 状态 转移 图 


我 们 可 以 建立 一 个 每 一 行 代表 一 个 状态 的 状态 转移 表 ( 表 17-1 )。 表 有 5 栏 : 当前 状态 、 
读 和 符号、 所 写 符号 、 读 / 写 头 的 移动 方向 和 下 一 个 符号 。 既 然 机 器 只 能 经 历 有 限 个 状态 ， 
那么 我 们 能 创建 一 个 像 我 们 在 第 5 章 中 为 简单 计算 机 建立 的 指令 集 。 


表 17-1 状态 转移 表 

A | hb | +» | =* | 4 

:| 1 | :1 | =* | 3 

EE. 

TE A 

ce | +» | | + | 4 

3 
指令 是 把 一 行 中 的 5 列 值 放 在 一 起 ， 对 于 这 人 台 初 级 的 机 器 ， 我 们 只 有 6 条 指令 : 
1 CN Dy RR 3 (B.D Ts BR, HB 5..(C, Bs Ds BM 


> (BD, 1 DB Ms © 区 


例如 ， 第 一 条 指令 是 说 : 如 果 机 器 处 于 状态 A， 读 到 了 符号 b， 它 就 用 一 个 新 的 b 改写 
符号 ， 读 / 写 头 向 右 移 到 下 一 个 符号 上 ， 机 器 的 状态 转移 到 状态 A， 也 就 是 保留 在 相同 的 状 
态 中 。 

一 个 图 灵机 只 有 两 个 状态 和 如 下 的 4 条 指令 : 

《了 A 人 35 CH Ds;: By 

二 

如 果 机 器 用 图 17-5 所 示 的 配置 开始 。 这 是 在 执行 完 上 一 条 指令 后 的 机 器 配置 。 注 意 机 
让 只 能 执行 一 条 指令 ， 它 满足 当前 状态 和 当前 符号 。 





图 17-5 例 17-1 


解 ” 机 器 是 处 于 状态 A， 当 前 符号 是 1， 这 就 意味 着 只 有 第 二 条 指令 (A，1，1，R，B) 
能 被 执行 。 新 的 配置 也 在 图 17-5 中 显示 。 注 意 控制 器 的 状态 已 经 变 成 了 B， 读 / 写 头 已 经 向 
右 移 动 了 一 个 符号 。 
17.2.2 ”对 简单 语言 的 模拟 

我 们 现在 能 编写 程序 来 实现 简单 语言 的 语句 了 。 注 意 这 些 语句 可 以 用 多 种 方法 来 写 ， 为 


了 学 习 的 目的 ， 我 们 选择 了 最 简单 或 最 方便 的 ， 但 它们 不 一 定 是 最 好 的 。 


1. 递增 语句 
17-6 显示 了 incr(X) 语句 的 图 灵机 。 控 制 器 有 4 个 状态 ， 从 Si 到 S:， 状 态 S, 是 开始 
状态 ， 状 态 S: 是 右 移 的 状态 ， 状 态 S; 是 左 移 的 状态 ， 状 态 S4 是 停机 状态 。 如 果 到 达 停 机 状 


态 ， 机 器 就 停止 : 没有 指令 从 这 个 状态 开始 。 


(SbbRS A IIAR 
(Ss 1,1,R,5;) , 


(Ssb,1,L,S,) 
Sy SY 
(Snb,b,N, Si) = 





停机 


WL 


图 17-6 语句 incr(X) 的 图 灵机 


图 17-6 还 显示 了 incr(X) 语句 的 程序 。 它 有 5 条 指令 。 过 程 从 义 (要 加 1 的 数据 ) 左 
边 的 空白 符号 开始 ， 向 右 移 过 所 有 的 1， 直 到 到 达 X 右边 的 空白 符号 。 它 把 此 空白 改 成 1。 
它 再 向 左 移 过 所 有 的 1， 直 到 又 一 次 到 达 左 边 的 空白 。 在 这 点 上 它 停机 。 注 意 我 们 也 给 出 
了 移动 读 / 写 头 回 到 X 左边 空白 符号 的 程序 ， 如 果 在 X 上 有 多 个 操作 要 进行 ， 这 个 程序 是 
需要 的 。 

显示 图 灵机 如 何 使 XX 递增 的 ， 这 里 义 =2。 

解 ” 图 17-7 展示 了 解 。X 的 值 (在 一 元 系统 中 为 11 ) 存储 在 两 个 空白 符号 之 间 。 它 使 
用 了 7 个 步骤 使 X 递 增 ， 并 且 读 / 写 头 回 到 原先 的 位 置 。 第 1 步 到 第 4 步 把 读 / 写 头 移 到 XX 
的 末端 ， 第 5 步 到 第 7 步 改变 末端 的 空白 和 把 读 / 写 头 移 回 它 原先 所 在 的 位 置 。 

2. 递减 语句 

我 们 使 用 最 小 的 指令 数目 来 实现 decr(X) 语句 。 原 因 是 我 们 在 下 一 条 语句 ( while 循环 ) 
中 要 用 到 这 个 语句 ， 它 也 被 用 来 实现 所 有 的 宏 。 图 17-8 显示 了 这 条 语句 的 图 灵机 。 控 制 嚣 
有 三 个 状态 : SI,、S: 和 S;。 状 态 Si 是 开始 状态 ， 状 态 Sz 是 检查 语句 ， 它 检查 当前 符号 是 1 
还 是 b。 如 果 是 b， 语 句 进入 停机 状态 ; 如 果 下 一 个 符号 是 1， 第 二 条 语句 把 它 改 成 b， 然 后 
再 进入 停机 状态 。 图 17-8 还 显示 了 这 条 语句 的 程序 。 
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图 17-8 decx(X) 语句 的 图 灵机 


显示 图 灵机 如 何 使 又 递减 的 ， 这 里 X=2。 

解 ”图 17-9 展示 了 解 。 机 器 从 数据 左边 的 空白 开始 ， 如 果 下 一 个 符号 为 1， 机 器 把 它 
改 成 空白 。 读 / 写 头 停止 在 结果 数据 左边 的 空白 字符 上 。 这 是 与 递增 语句 中 的 相同 安排 。 注 
意 ， 我 们 可 能 已 经 把 读 / 写 头 移 到 数据 的 末端 ， 删 除了 最 后 的 1， 而 不 是 第 一 个 1。 但 这 个 
程序 比 我 们 的 版 本 要 长 得 多 。 因 为 我 们 在 每 个 循环 语句 中 都 需要 这 条 语句 ， 所 以 我 们 使 用 了 
简短 的 版 本 来 节省 指令 的 数目 。 我 们 在 下 一 节 要 介绍 的 while 循环 语句 中 使 用 了 这 条 语句 的 


简短 版 本 。 
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图 17-9 例 17-3 
3. 循环 语句 


为 了 模拟 循环 ， 我 们 假定 X 和 循环 体 处 理 的 数据 存储 在 磁带 上 ， 中 间 以 单个 空白 符号 
相隔 。 图 17-10 显示 了 通常 循环 语句 的 表 、 程 序 和 状态 转移 图 。 

三 个 状态 S$;、Ss 和 Si 特制 了 循环 ， 它 通过 判断 X 的 值 ， 如 果 X=0， 就 退出 循环 。 把 
这 三 个 状态 与 图 17-8 中 递减 语句 中 使 用 的 三 个 状态 进行 比较 。 状 态 Ma 把 读 / 写 头 移 过 
在 每 次 重复 中 在 处 理 数据 开始 时 定义 了 数据 开始 位 置 的 空白 符号 ; 状态 Mr 把 读 / 写 头 移 
过 在 每 次 重复 中 在 处 理 数据 结束 时 定义 了 X 的 开始 位 置 的 空白 符号 ; 状态 Bs 定义 了 循环 
体 的 开始 状态 ， 而 状态 Br 定义 了 循环 体 的 停机 状态 。 循 环 体 在 这 两 个 状态 间 可 能 有 几 个 
状态 。 

图 17-10 还 显示 了 语句 的 循环 性 质 。 状 态 图 本 身 是 一 个 只 要 义 的 值 不 为 0 就 重复 的 循 
环 。 当 X 的 值 变 成 0， 循 环 停止 ， 状 态 S; (停机 状态 ) 到 达 了 。 
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图 17-10 while 循环 语句 的 图 灵机 


让 我 们 显示 一 个 非常 简单 的 例子 。 假 设 我 们 要 模拟 第 四 个 宏 ，Y 二 Y+X。 像 
我 们 前 面 讨论 的 一 样 ， 这 个 宏 可 以 用 简单 语言 中 的 while 语句 来 模拟 : 
while (X) 
{ 
decr (X) 


incr (Y) 


} 


为 了 使 过 程 简 短 ， 我 们 假设 X=2 和 Y=3。 因 x Y 
结果 是 Y=5。 图 17-11 显示 了 应 用 安之 前 和 可 1|1 困 1 1 ET 
二 二 委 和 的 具 注意 : 在 这 个 程序 中 我 们 消除 之 前 
了 XX 的 值 ， 使 得 过 程 更 简短 。 但 如 果 我 们 在 磁带 ee 
上 允许 其 他 符号 ，X 的 原始 值 是 可 以 保存 的 。 2 1|1|1|1| 1 
因为 X=2， 程 序 重复 两 次 。 第 一 次 重复 结 之 后 
束 时 , X=1,，Y=4。 第 二 次 重复 结束 时 ,X=0， 图 17-11 例 17-4 中 磁带 的 配置 
Y=5。 


17.2.3” 印 育 - 图 灵 论 题 


我 们 显示 了 图 灵机 能 模拟 简单 语言 中 的 三 个 基本 语句 。 这 就 意味 着 图 灵机 能 模拟 我 们 为 
简单 语言 定义 的 所 有 的 宏 。 那 么 图 灵机 是 否 能 解决 一 人 台 计 算 机 能 解决 的 任何 问题 ? 这 个 问题 
> 本 Ce Ty ey) 中 找到 。 

ee 
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基于 这 样 的 观点 ， 能 用 写 一 个 算法 来 完成 的 任何 符号 操纵 任务 也 可 以 用 图 灵机 完成 。 注 
意 这 只 是 论题 ， 不 是 定理 。 定 理 可 以 在 数学 上 得 到 证 明 ， 但 论题 却 不 能 。 虽 然 这 个 论题 可 能 永 
远 得 不 到 证 明 ， 但 有 些 强 有 力 的 论断 在 支持 它 。 首 先 ， 尚 未 发 现 有 图 灵机 不 能 模拟 的 算法 ; 其 
次 ， 所 有 在 数学 上 已 经 得 到 证 明 的 计算 机 模型 都 与 图 灵机 模型 等 价 ， 这 个 论断 是 得 到 证 明 的 。 


17.3 ”歌德 尔 数 

在 计算 机 科学 理论 中 ， 一 个 无 符号 数 能 被 分 配给 任何 用 特定 语言 编写 的 程序 ， 通 常 称 为 
歌德 尔 数 (用 澳大利亚 数学 家 Kurt G6del 的 名 字 命名 )。 

这 种 分 配 有 很 多 优点 。 首 先 ， 程 序 可 以 作为 单一 数据 项 输入 给 其 他 程序 。 第 二 ， 程 序 
可 以 通过 它 的 整数 表示 来 引用 。 第 三 ， 该 编号 方式 可 以 用 来 证 明 有 一 些 问 题 计算 机 并 不 能 解 
决 ， 从 而 说 明 世 界 上 问题 的 数量 远 远 比 曾经 编写 的 程序 数量 要 多 得 多 。 

各 种 各 样 的 方法 被 设计 用 来 给 程序 编号 。 我 们 用 一 个 简单 的 变换 给 用 简单 语言 编写 的 程 
序 编号 。 假 定 简单 语言 仅 使 用 15 个 标志 符 ( 表 17-2 )。 


表 17-2 简单 语言 中 符号 的 编码 


和 TT TE 


9 


cl 全 | | 一 
IWIIIOIWI> 


注意 ， 在 这 种 语言 当中 仅 使 用 X，Xi，X:，…，Xs 作为 变量 。 为 了 将 变量 编码 ， 将 X。 
看 成 是 由 X 和 nn 两 个 符号 组 成 来 处 理 (Xs 是 由 XX 和 3 组 成 )。 如 果 在 宏 中 有 其 他 类 型 变量 ， 
应 将 它们 转换 为 X, 的 形式 。 


17.3.1 表示 一 个 程序 

运用 这 个 表 ， 我 们 可 以 通过 唯一 的 正 整数 表示 用 简单 语言 编写 的 任何 程序 。 按 照 以 下 步 
又 进行 : 

1 ) 将 每 一 个 符号 用 表 中 所 给 的 对 应 十 六 进 制 代 码 替代 。 

2 ) 将 最 后 的 结果 (十 六 进 制 ) 转化 为 无 符号 整数 。 

对 于 程序 incr(X) 来 说 ， 什 么 是 歌德 尔 数 呢 ? 

解 ” 用 对 应 的 十 六 进 制 代 码 替代 每 个 符号 : 


Liner ZX = (AP}is=* 35 


所 以 ， 这 个 程序 可 以 用 数字 175 表述 。 


17.3.2 ”翻译 一 个 数字 
为 了 证 明 编 号 方式 是 唯一 的 ， 用 以 下 步骤 来 解释 歌德 尔 数 
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1 ) 将 数字 转换 成 十 六 进 制 数 。 

2 ) 用 表 17-2 将 每 个 十 六 进 制 数 翻译 成 对 应 的 符号 (忽略 0 )。 

注意 ， 有 虽然 用 简单 语言 编写 的 一 切 程序 都 能 用 数字 表述 ， 但 是 ， 并 不 是 所 有 的 数字 都 能 
生生 发 全 入 程序 。 转换 之 后 ， 如 果 符 号 不 符合 语法 规则 ， 这 个 数字 就 不 是 有 效 的 程序 。 

和 将 3058 翻译 成 程序 。 

解 ”将 数字 变 成 十 六 进 制 数 并 用 相应 的 符号 代替 ; 


3058 一 {BF2)isc 一 decr X 2 一 decr (X;) 


这 意味 着 在 简单 语言 中 的 等 价 代 码 是 decr(X;)。 注 意 ， 在 简单 语言 中 ， 每 个 程序 都 包括 
输入 和 输出 。 这 意味 着 程序 和 它 的 输入 的 组 合 定义 了 歌德 尔 数 。 


17.4 停机 问题 


几乎 所 有 的 简单 语言 编写 的 程序 都 包含 某 种 形式 的 重复 (循环 或 递归 函数 )。 一 个 重复 
结构 可 能 永远 都 不 会 结束 (停机 ); 这 就 是 说 ,一 个 含有 无 限 循环 的 程序 可 以 永远 运行 。 例 
如 ， 下 面 用 简单 语言 编写 的 程序 可 以 永 不 结束 。 z 

X + 1 

while (X) 


{ 
) 


一 个 典型 的 编程 问题 是 : 
我 们 能 编号 一 个 各 库 沫 测试 任何 可 以 所 区 和 大 示 的 程 订 是 宕 妆 多 上 品 7 


该 程序 的 存在 将 会 节省 编程 人 员 的 大 量 时 间 ， 运行 一 个 程序 而 不 知道 它 是 否 可 以 终止 是 一 
项 枯燥 乏味 的 工作 。 不 幸 的 是 ， 现 在 已 经 证 明 这 样 的 程序 不 可 能 存在 编程 人 员 的 最 大 失望 )。 


17.4.1 停机 问题 是 不 可 解 的 

当 谈 到 这 样 的 测试 程序 不 存在 而 且 永 远 不 会 存在 时 ， 计 算 机 科学 家 会 说 :“ 停 机 问题 是 
不 可 解 的 ”。 

证 明 

下 面 给 出 这 样 的 测试 程序 不 存在 的 一 个 非 正 式 证 明 。 我 们 的 方法 在 数学 中 经 常 使 用 : 这 
就 是 反 证 法 。 我 们 假设 这 样 的 程序 存在 ， 然 后 证 明 它 的 存在 将 产生 一 个 矛盾 ， 因 此 它 不 可 能 
存在 。 我 们 用 下 面 三 个 步骤 给 出 该 方法 的 证 明 过 程 。 

第 一 步 

在 此 步骤 中 假设 存在 一 个 命名 为 Test 的 
程序 ， 它 能 接收 其 他 任何 程序 ， 例 如 P， 用 它 
的 歌德 尔 数 表示 作为 输入 ， 并 且 输 出 为 1 或 0。 
如 果 了 终止 ， 则 Test 程序 输出 为 1 ; 如 果 了 不 ， 
终止 ， 则 Test 程序 输出 为 0 (图 17-12 )。 

第 二 步 

在 这 一 步 中 ， 我 们 创建 另 一 个 程序 ， 叫 X 
作 Strange， 它 由 两 部 分 组 成 : 开始 为 程序 图 17-12 证 明 的 第 一 步 
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Test 的 副本 ， 末 尾 是 一 个 空 循环 (用 一 个 空 体循环 )。 循 环 用 和 X 作为 测试 变量 ， 它 实际 上 是 
程序 Test 的 输出 。 这 个 程序 也 用 P 作为 输入 。 我 们 之 所 以 称 这 个 程序 为 Strange 是 因为 : 如 
果 了 终止 ， 程 序 的 第 一 部 分 ( Test 程序 的 副本 ) 输出 1， 这 个 1 输入 循环 体 ， 循 环 不 终止 
(无 限 循环 )， 相 应 的 程序 Strange 也 不 会 终止 。 如 果 了 不 终止 ， 程 序 的 第 一 部 分 (Test 程序 
的 副本 ) 输出 0。 这 个 0 输入 循环 体 ， 循 环 终止 ( 它 现在 是 一 个 有 限 循 环 ， 循 环 从 未 重复 )， 
随后 ， 程 序 Strange 终止 。 换 句 话说 ， 人 


如 果 了 终止 ， Strange 不 终止 。 eg 
如 果 了 不 终止 ,*Strange 终 止 。 0 


图 17-13 给 出 证 明 的 第 二 步 。 


Strange 





图 17-13 证 明 的 第 二 步 


第 三 步 
编写 了 Strange 程序 后 ， 我 们 用 程序 自身 〈 它 的 歌德 尔 数 ) 作为 输入 来 测试 它 ， 这 是 合 
法 的 ， 因 为 我 们 没有 给 程序 了 任何 约束 条 件 。 图 17-14 给 出 了 此 情况 的 示意 图 。 


Strange 








如 果 程 序 Strange 终 止 ， 











程序 Strange 则 程序 Strange 不 终止 。 
(歌德 尔 数 ) 如 果 程 序 Strange 不 终止， 
则 程序 Strange 终 止 。 


矛盾 


矛盾 


假设 程序 Test 存在 ， 我 们 得 到 以 下 
旭 时 程序 Soanee 经 止 ， 则 入 Strahee 术 安 
a Strange 不 终止 ， 则 程序 2 i 
这 证 明 Test 程序 不 存在 ， 我 们 应 停止 查找 该 程序 ， 所 以 
ll ee 
停机 问题 的 不 可 解 性 已 经 证 明了 许多 其 他 问题 也 是 不 可 解 的 ， 因 为 如 果 它 们 可 解 ， 那 么 

停机 问题 也 可 解 ， 而 停机 问题 却 不 可 解 。 


17.5 ”问题 的 复杂 度 
既然 我 们 已 经 证 明 : 至 少 有 一 个 问题 计算 机 无 法 解决 ， 那 么 让 我 们 在 这 个 问题 上 再 进 一 
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步 深入 。 在 计算 机 科学 领域 ,我 们 可 以 这 么 说 ， 一 般 来 说 问题 可 以 分 为 两 类 ， 可 解 问 题 和 不 
可 解 问题 。 可 解 问题 又 可 以 分 为 两 种 : 多 项 式 问 题 和 非 多 项 式 问 题 (图 17-15 )。 


17.5.1 不 可 解 问题 


无 法 用 计算 机 解决 的 问题 有 无 穷 无 尽 ， 
停机 问题 是 其 中 一 个 。 要 证 明 一 个 问题 是 无 
法 解决 的 ， 方 法 是 证 明 如 果 它 可 以 解决 ， 那 
么 停机 问题 也 同样 可 以 解决 ， 换 句 话 说， 证 
明 一 个 问题 能 否 解决 等 同 于 证 明 停机 问题 能 
否 解决 。 图 17-15 ”问题 的 分 类 









17.5.2 可 解 问题 


能 够 被 计算 机 解决 的 问题 也 是 无 穷 无 尽 ， 平 常 我 们 关心 的 是 : 计算 机 需要 花 多 长 时 间 去 
解决 一 个 问题 。 换 言 之 ， 这 个 问题 有 多 复杂 ? 

问题 的 复杂 度 可 以 用 不 同 的 方法 衡量 ， 例 如 ， 运 行 时 间 、 需 要 的 内 存 等 。 其 中 一 种 衡量 
方法 是 运行 时 间 ， 即 运行 一 个 程序 需要 花 多 长 时 间 ? 

可 解 问题 的 复杂 度 

衡量 可 解 问题 复杂 度 的 一 个 方法 是 找 出 计算 机 运行 该 程序 时 要 执行 的 运算 数量 。 这 样 ， 
复杂 度 问 题 不 是 依赖 于 运行 程序 的 计算 机 速度 ， 而 是 依赖 于 输入 的 数目 。 例 如 ， 如 果 程 序 在 
处 理 一 个 列表 (例如 对 列表 中 元 素 进行 排序 )， 则 复杂 度 依赖 于 该 列表 中 元 素 的 数目 。 

大 0 表示 法 

相对 于 当今 计算 机 的 速度 ， 我们 关心 的 是 程序 总 体 的 数量 级 而 不 是 精确 的 数字 。 例 如 ， 如 
果 对 两 个 程序 的 分 析 显 示 : 其 中 一 个 执行 15 个 运算 (或 一 组 运算 )， 另 一 个 执行 25 个 ， 它 们 都 
运行 得 很 快 ， 以 至 于 看 不 出 有 什么 不 同 。 但 假设 运算 数量 是 15 比 1500， 我们 就 应 该 考虑 它 了 。 

效率 的 简化 以 大 0 表示 法 最 为 著名 。 在 这 里 ， 只 给 出 该 表示 法 的 思想 并 不 深入 研究 它 
的 正式 定义 和 计算 。 在 该 表示 法 中 ， 运 算数 量 (或 一 系列 相关 运算 ) 表示 为 输入 量 的 函数 。 
符号 O(n) 表示 及 n 个 输入 ， 执行 n 次 运算 ; 符号 O(m?) 表示 及 个 输入 ， 执 行 mn? 次 运算 。 
是 时 儿 假设 编写 了 三 个 不 同 的 程序 来 解决 同一 问题 ， 第 一 个 程序 复杂 度 为 O(logion)， 
第 二 个 程序 复杂 度 是 0(n)， 第 三 个 程序 复杂 度 是 O(n”)。 假 设 输入 为 100 万 ， 那 么 在 一 台 一 
条 指令 执行 时 间 为 1 微 秒 (每 秒 100 万 次 ) 的 计算 机 上 分 别 运行 它们 ， 各 和 需 多 少时 间 呢 ? 

解 ” 分 析 如 下 : 





第 一 个 程序 ; n=1 000 000 O(logion) 一 6 Time 一 6hs 
第 二 个 程序 ， n=1 000 000 O(n) 一 1000000 Timne 一 1s 

第 三 个 程序 ; n=1 000 000 OU 一 102 Time —* 277 h 
多 项 式 问 题 


如 果 程 序 的 复杂 度 为 O(log n)、O(n)、O(n)、O( 码 )、O(n') 或 O(n) (为 常数 )， 则 被 
称 为 多 项 式 问 题 。 以 当今 计算 机 的 处 理 速度 ， 对 于 一 个 有 合理 输入 数量 的 (如 从 1 000 到 
1 000 000 ) 的 多 项 式 问 题 我 们 都 能 解决 。 

非 多 项 式 问题 

如 果 一 个 程序 的 复杂 度 远 比 多 项 式 问题 复杂 ， 例 如 O(10") 或 O(n!)， 当 输入 数 很 小 (小 
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于 100 ) 时 ， 这 种 问题 可 以 解决 。 如 果 输 入 数 很 大 ， 则 需要 坐 在 计算 机 面前 等 上 几 个 月 的 时 
间 才 能 看 到 非 多 项 式 问 题 的 解决 结果 。 但 是 ， 随 着 计算 机 处 理 速度 的 不 断 提高 ， 我 们 也 许 能 


在 更 短 的 时 间 内 解决 非 多 项 式 问题 。 


17.6 ” 章 末 材料 
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。 Hofstadter, D. Godel, Escher, Bach: An Eternal Golden Braid, St. Paul, MN: Vintage, 1980 

。 Hopcroft, J., Motwani, R. and Ullman, J. Introduction to Automata Theory, Languages, 
and Computation, Reading, MA: Addison-Wesley, 2006 

® Kfoury, A., Moll, R. and Michael, A. A Programming Approach to Computability, New 
York: Springer, 1982 

e。 Minsky, M. Computation: Finite and Infinite Machines, Engelwood Cliffs, NJ: Prentice- 


Hall, 1967 
® Sipser, M. Introduction to the Theory of Computation, Boston, MA: Course Technology, 
2005 
关键 术语 
big-O notation (大 O 表示 法 ) loop statement (循环 语句 ) 
Church-Turing thesis ( 气 奇 - 图 灵 论 题 ) macro ( 宏 ) 
controller (控制 器 ) nonpolynomial problem ( 非 多 项 式 问题 ) 
decrement statement (递减 语句 ) polynomial problem (多 项 式 问 题 ) 
finite state automation (有 限 状 态 自动 机 ) read/write head ( 读 / 写 头 ) 
Gidel number (歌德 尔 数 ) solvable problem (可 解 问题 ) 
halting problem (停机 问题 ) Turing machine (图 灵机 ) 
hexadecimal digit (十 六 进 制 数 ) unsolvable problem (不 可 解 问题 ) 
increment statement (递增 语句 ) 


小 结 

。 我 们 可 以 定义 一 种 只 有 三 种 语句 的 计算 机 语言 : 递增 语句 、 递 减 语 句 和 循环 语句 。 递 
增 语 句 给 变量 加 1。 递 减 语 句 给 变量 减 1。 循 环 语句 是 在 变量 的 值 不 为 0 时， 重复 一 
个 动作 或 一 系列 动作 。 

。 可 以 证 明 这 种 简单 的 语言 能 模拟 一 些 流行 语言 中 的 多 个 语句 。 我 们 把 每 个 模拟 称 为 为 
一 个 宏 ， 它 可 以 在 其 他 模拟 中 使 用 ， 而 不 需要 重复 编码 。 

。 图 灵机 是 为 解决 可 计算 问题 而 设计 的 ， 它 是 现代 计算 机 的 基础 。 图 灵机 由 三 部 分 构 
成 : 磁带 、 控 制 器 和 读 / 写 头 。 

。 基于 邱 奇 - 图 灵 论 题 ， 如 果 存 在 一 个 完成 符号 操纵 任务 的 算法 ， 那 么 完成 此 任务 的 图 
灵机 也 是 存在 的 。 
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。 在 理论 计算 机 科学 中 ， 在 具体 的 计算 机 语言 中 ， 一 个 分 配给 任何 程序 的 无 符号 数 称 为 


歌德 尔 数 。 


。 一 个 经 典 的 编程 问题 是 能 否 构 造 一 个 可 以 预言 男 一 程序 是 否 会 结束 的 程序 。 不 幸 的 是 


已 经 证 明 这 样 的 程序 是 不 存在 的 ， 停 机 问题 是 不 可 解 的 。 


。 在 计算 机 科学 中 ， 问 题 可 以 分 成 两 类 : 可 解 问题 和 不 可 解 问题 ， 可 解 问题 本 身 可 以 分 


为 多 项 式 问 题 和 非 多 项 式 问 题 。 


17.7 练习 
小 测验 


在 本 书 网 站 上 提供 了 一 套 与 本 章 相 关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q17-1 
Q17-2 
Q17-3 
Q17-4 
Q17-5 
Q17-6 
Q17-7 
Q17-8 
Q17-9 


在 简单 语言 中 ， 有 三 种 基本 语句 是 其 他 语句 的 基础 ， 说 出 它们 的 名 字 ， 并 描述 它们 的 功能 。 


说 明 如 何 用 三 种 基本 语句 把 一 个 变量 的 值 赋 给 男 一 个 变量 。 

图 灵机 和 简单 语言 间 有 何 关系 ? 

说 明 图 灵机 的 组 成 和 每 一 部 件 的 功能 。 

图 灵机 磁带 是 如 何 划 定数 据 界限 的 ? 

当 读 / 写 头 完成 读 或 写 一 个 符号 后 ， 下 一 步 是 什么 ? 

状态 转移 图 与 图 灵机 控制 器 有 何 联系 ? 

转移 图 与 转移 表 有 何 联系 ? 它们 有 相同 的 信息 吗 ? 谁 包含 的 信息 要 多 些 ? 
什么 是 歌德 尔 数 ?怎样 用 歌德 尔 数 证 明 停 机 问题 是 不 可 解决 的 ? 


Q17-10 ”比较 并 区 分 多 项 式 可 解 问题 和 非 多 项 式 可 解 问题 的 复杂 度 。 
练习 题 


P17-1 
P17-2 
P17-3 
P17-4 
P17-5 


P17-6 


P17-7 


重 写 算法 17.6 (Y + 一 XX)， 使 得 它 能 保存 XX 的 值 。 

重 写 算法 17.7， 使 得 它 在 计算 Z + 一 义 +Y 的 同时 能 保存 XX 和 YY 的 值 。 
重 写 算法 17.8， 使 得 它 在 计算 Z*- YXX 的 同时 能 保存 XX 和 YY 的 值 。 
重 写 算法 17.9， 使 得 它 在 计算 Z 一 Yx 的 同时 能 保存 X 和 YY 的 值 。 
使 用 前 面 定义 的 语句 或 用 简单 语言 编写 的 宏 来 模拟 下 面 的 宏 ; 
YY—X 


使 用 前 面 定义 的 语句 或 用 简单 语言 编写 的 宏 来 模拟 下 面 的 宏 (X 只 能 是 0 或 1 ); 


if (X) then 


A 


给 定 一 台 带 有 一 条 指令 (A，1，b，R，B) 的 图 灵机 和 如 下 的 磁带 配置 : 


| 
~ 得 证 玖 as 


显示 出 磁带 的 最 终 配 置 。 
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P17-8 给 定 一 台 带 有 一 条 指令 (A，b，b，R，B) 的 图 灵机 和 如 下 的 磁带 配置 : 


| 
sw | 全) 昌 pp *** 
显示 出 磁带 的 最 终 配 置 。 
P17-9 给 定 一 台 带 有 5 条 指令 (A, b, b, R, B)、(B, 1, #, R, B)、 (B, b, b, L, C)、(C, #, 
1，L，C)、(C，b，b，R，B) 的 图 灵机 和 如 下 的 磁带 配置 : 


! 
so 


显示 出 磁带 的 最 终 配 置 。 
P17-10 显示 给 一 个 二 进 制 中 的 非 负 整数 加 1 的 图 灵机 的 状态 图 。 例 如 ， 磁 带 的 内 容 为 (101):， 它 将 


被 改 成 (110):。 
P17-11 显示 图 灵机 中 对 语句 incr(X) 的 模拟 (如 本 章 定义 的 )， 当 X= 0 时 ， 给 出 正确 的 答案 。 
P17-12 显示 图 灵机 中 对 语句 decr(X) 的 模拟 (如 本 章 定 义 的 )， 当 X= 0 时 ， 给 出 正确 的 答案 。 
P17-13 ”显示 图 灵机 中 对 循环 语句 的 模拟 (如 本 章 定义 的 )， 当 我 们 允许 使 用 像 # 这 样 的 其 他 符号 时 ， 
该 图 灵机 能 改 成 可 以 保存 X 的 原始 值 。 
P17-14 给 出 图 灵机 模拟 宏 义 -0 的 状态 转移 图 和 程序 。 
P17-15 给 出 图 灵机 模拟 宏 Y + 一 XX 的 状态 转移 图 和 程序 。 
P17-16 一 台 图 灵机 使 用 单个 1 来 表示 整数 0， 说 明 整 数 n 在 此 机 器 上 是 如 何 表示 的 。 
P17-17 宏 X +0 的 歌德 尔 数 是 什么 ? 
P17-18 宏 X, 2 的 歌德 尔 数 是 什么 ? 
P17-19 宏 X 一 X, + Xz 的 歌德 尔 数 是 什么 ? 


| 第 18 章 


Foundations of Computer Science, Fourth Edition 


人 工 智 能 


在 本 章 中 ， 我 们 将 对 人 工 智能 (AI) 作 简单 的 介绍 。 首 先 介绍 人 工 智 能 的 简 史 和 定义 ， 
接 下 来 讨论 知识 表示 ， 它 是 人 工 智 能 中 的 一 个 广泛 介绍 且 得 到 很 好 发 展 的 领域 。 然 后 ， 我 们 
介绍 专家 系统 ， 当 需要 人 类 专家 而 专家 不 可 用 时 ， 这 些 系统 能 代替 人 类 专家 工作 。 接 着 我 们 
讨论 在 图 像 处 理 和 语言 分 析 两 个 领域 中 人 工 智能 是 如 何 用 来 模仿 人 类 行为 的 。 接 着 ， 我 们 说 
明 使 用 不 同 的 搜索 方法 ， 专 家 系统 和 平凡 系统 是 如 何 解决 问题 的 。 最 后 ， 我 们 讨论 在 智能 体 
中 神经 网 络 是 如 何 模仿 学 习 过 程 的 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 和 定义 和 叙述 人 工 智能 的 简 史 ; 

。 描述 知识 在 智能 体 中 是 如 何 表示 的 ; 

。 说 明 当 人 类 专家 不 可 用 时 ， 专 家 系统 是 如 何 使 用 的 ; 

。 说 明 如 何 用 人 工 智 能 体 来 模仿 人 类 完成 任务 ; 

。 说 明 专 家 系统 和 平凡 系统 是 如 何 使 用 不 同 的 搜索 方法 解决 问题 的 ; 

。 说 明 人 类 的 学 习 过 程 是 如 何 被 模仿 的 ， 在 一 定 程度 上 ， 使 用 神经 网 络 创建 的 电子 版 神 

经 元 称 为 感知 器 。 


18.1 引言 

这 一 部 分 我 们 非 正 式 地 定义 人 工 智能 ( AI) 这 个 词 ， 然 后 给 出 它 的 简 史 。 我 们 同时 也 定 
义 了 智能 体 和 它 的 两 大 类 别 。 最 后 我 们 介绍 两 种 在 人 工 智能 中 常用 的 编程 语言 。 
18.1.1 什么 是 人 工 智能 

虽然 人 工 智能 没有 公认 的 定义 ， 但 我 人 采用 如 下 与 本 章 标 题 相 匹配 的 定义， 


ey) ye PS DR 
F 局 条 四 FF 
人 《人 一 






18.1.2 人工 智能 简 史 


虽然 人 工 智能 作为 一 门 独立 的 学 科 是 相对 年 轻 的 ,但 它 还 是 经 历 了 一 段 发 展 的 时 间 。 我 
们 可 以 这 样 说 ， 当 2400 年 前 希腊 哲学 家 亚 里 多 斯 德 发 明了 逻辑 推理 这 个 概念 时 ， 人 工 智 能 
就 开始 了 ， 接 着 莱 布 尼 茨 和 牛顿 完成 了 逻辑 语言 的 定稿 。 乔 治 ' 布尔 在 19 世纪 逐步 提出 的 
布尔 代数 (附录 E) 葛 定 计算 机 电子 电路 的 基础 。 但 是 ， 思 维 计算 机 的 主要 思想 却 来 自 阿 
兰 ' 图 灵 ， 他 提出 了 图 灵 测 试 。 "人工 智 能 ”这 个 术语 是 John McCarthy (约翰 * 麦 卡 思 ) 在 


1956 年 首次 提出 的 。 
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18.1.3 图 灵 测 试 

在 1950 年 ， 阿兰 : 图 灵 提 出 了 图 灵 测 试 ， 这 个 测试 提出 了 机 器 具有 智能 的 一 个 定义 。 
该 测试 的 方法 是 ， 简 单 地 比较 人 类 的 智能 行为 和 计算 机 的 智能 行为 。 一 个 询问 者 对 计算 机 和 
人 类 都 提出 一 组 问题 ， 然 后 ， 询 问 者 得 到 两 组 答案 ， 但 他 不 知道 哪 一 组 是 来 自 人 类 ， 哪 一 组 
来 自 计 算 机 。 在 仔细 检查 两 组 答案 后 ， 如 果 询 问 者 不 能 肯定 地 说 出 哪 一 组 来 目 人 类 ， 哪 一 组 
来 自 计 算 机 ， 那 么 ， 计 算 机 就 通过 了 具有 智能 行为 的 图 灵 测 试 。 


18.1.4 智能 体 
智能 体 是 一 个 能 智能 地 感知 环境 、 从 环境 中 学 习 并 与 环境 进行 交互 的 系统 。 智 能 体 可 以 
分 成 两 大 类 : 软件 智能 体 和 物理 智能 体 。 


1. 软件 智能 体 
软件 智能 体 是 一 组 用 来 完成 特殊 任务 的 程序 。 例 如 ， 有 些 智 能 系统 能 用 来 整理 电子 邮件 


(e-mail)， 能 检查 收 到 的 邮件 的 内 容 ， 然 后 把 它们 归 到 不 同 的 类 别 中 (垃圾 、 不 重要 、 重 要 、 
非常 重要 等 )。 另 外 一 个 软件 智能 体 的 例子 是 搜索 引擎 ， 它 搜索 万 维 网 ， 发 现 能 提供 与 查询 
主题 相关 信息 的 网 址 。 


2. 物理 智能 体 
物理 智能 体 (机 器 人 ) 是 一 个 用 来 完成 各 项 任务 的 可 编程 系统 。 简 单 的 机 器 人 可 以 用 在 


制造 行业 ， 从 事 一 些 日 常 的 工作 ， 如 装配 、 焊 接 或 油污 。 有 些 组 织 使 用 移动 机 带 人 去 做 一 些 
日 常 的 分 发 工作 ， 如 分 发 邮件 或 明信片 到 不 同 的 房间 。 移 动机 器 人 可 以 在 水 下 探测 石油 。 

人 型 机 器 人 是 一 种 自治 的 移动 机 器 人 ， 它 模仿 人 类 的 行为 。 虽 然 人 型 机 器 人 只 在 科幻 小 
说 中 流行 ， 但 是 要 使 这 种 机 器 人 能 合理 地 与 周围 环境 交互 并 从 环境 里 发 生 的 事件 中 学 习 ， 这 


里 面 还 有 很 多 工作 要 做 。 


18.1.5 编程 语言 
虽然 有 些 通用 语言 (如 C、C++ 和 Java) 能 用 来 编写 智能 软件 ， 但 有 两 种 语言 是 特别 为 
人 工 智能 设计 的 ， 它 们 是 LISP 和 PROLOG。 


1. LISP 

LISP (LISt Programming) 是 约翰 麦 卡 思 在 1958 年 发 明 的 ， 顾名思义，LISP 是 一 种 
操纵 表 的 编程 语言 。LISP 把 数据 和 程序 都 当成 表 ， 这 就 意味 着 LISP 程序 能 改变 它 自身 。 这 
个 特性 与 智能 体 的 理念 相 吻 合 ， 智 能 体能 从 环境 中 学 习 并 改善 自身 行为 。 

但 是 ，LISP 的 一 个 缺点 是 它 的 行动 迟缓 。 如 果 要 处 理 的 表 比 较 长 ，LISP 就 变 得 很 慢 。 
另 一 个 缺点 是 它 的 语法 复杂 。 

2. PROLOG 

PROLOG ( PROgraming in LOGic) 是 一 种 能 建立 事实 数据 库 和 规则 知识 库 的 编程 语 
言 。 使 用 PROLOG 编程 能 使 用 逻辑 推理 来 回答 那些 可 以 从 知识 库 中 推导 出 来 的 问题 。 但 是 ， 
PROLOG 不 是 一 种 效率 很 高 的 编程 语言 ， 有 些 复杂 问题 使 用 其 他 语言 (如 C、C++ 或 Java) 
来 解决 时 ， 效 率 更 高 。 


18.2 ”知识 表示 
如 果 打算 用 人 工 智能 体 来 解决 现实 世界 中 的 一 些 问题 ， 那 么 它 必须 能 表示 知识 。 事 实 被 
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表示 成 数据 结构 后 就 能 被 存储 在 计算 机 中 的 程序 操纵 。 这 一 节 ， 我 们 描述 4 种 常见 的 知识 表 
示 方 法 : 语义 网 、 框 架 、 谓 词 远 辑 和 基于 规则 的 系统 。 


18.2.1 语义 网 


语义 网 是 Richard H. Richens 在 20 世纪 60 年 代 提 出 的 。 语 义 网 使 用 有 向 图 表示 知识 。 
正如 在 第 12 章 讨 论 的 ， 有 向 图 由 顶点 (node) 和 边 (arc) 构成 。 语 义 网 用 顶点 代表 概念 ， 用 
边 〈 用 箭头 表示 ) 表示 两 个 概念 间 的 关系 (图 18-1 )。 





图 18-1 一 个 简单 的 语义 网 


1. 概念 
为 了 给 概念 一 个 准确 的 定义 ， 专 家 们 把 概念 的 定义 与 集合 理论 联系 起 来 。 因 此 ， 概 念 被 


看 成 一 个 集合 或 一 个 子 集 。 例 如 ,“ 动 物 ”是 所 有 动物 的 集合 ,“ 马 ”是 所 有 马 的 集合 ， 也 是 
“动物 ”的 子 集 。 对 象 是 集合 中 的 成 员 (实例 )， 概 念 用 顶点 表示 。 

2. 关系 

在 语义 网 中 ， 关 系 用 边 表示 。 一 条 边 可 以 定义 一 个 “ 子 类 ”关系 一 这 条 边 从 子 类 指向 超 
类 。 一 条 边 可 以 定义 一 个 “实例 ”关系 一 一 这 条 边 从 实例 指向 它 所 属 的 集合 。 一 条 边 也 可 以 
定义 一 个 对 象 的 属性 (颜色 、 大 小 …… )。 最 后 ， 一 条 边 可 以 定义 一 个 对 象 的 所 有 权 ， 例 如 
拥有 另外 一 个 对 象 。 语 义 网 能 很 好 定义 的 最 重要 的 关系 是 “继承 " 。 继 承 关 系 定义 明了 这 样 
一 个 事实 : 一 个 类 的 所 有 属性 将 出 现在 继承 的 类 中 。 这 可 以 用 来 从 用 图 表示 的 知识 中 推导 出 


新 的 知识 。 


18.2.2 框架 

框架 与 语义 网 紧密 相关 。 在 语义 网 中 ， 图 用 来 表示 知识 ; 在 框架 中 ,数据 结构 (记录 ) 
用 来 表示 相同 的 知识 。 与 语义 网 相 比 ， 框 架 的 一 个 优点 是 程序 更 容易 处 理 框架 ， 而 不 是 语义 
网 。 图 18-2 显示 了 如 何 用 框架 来 实现 图 18-1 中 的 语义 网 。 


1. 对 象 
语义 网 中 的 一 个 节点 变 成 了 一 组 框架 中 的 一 个 对 象 ， 所 以 一 个 对 象 可 以 定义 一 个 类 、 


一 个 子 类 或 类 的 一 个 实例 。 在 图 18-2 中 ， 扑 行动 物 、 哺 乳 动物 、 狗 、Roxy 和 Ringo 都 是 
对 象 。 
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2. 模 
语义 网 中 的 边 被 翻译 成 “ 槽 ”( 数 据 结构 中 的 域 )。 槽 的 名 字 定 义 了 关系 的 类 型 和 构成 夭 


系 的 槽 的 值 。 在 图 18-2 中 ， 动 物 是 爬行 动物 
对 象 的 一 个 覃 。 


18.2.3 ”谓词 逻辑 

最 通常 的 知识 表示 是 谓词 逻辑 。 谓 词 逻 
辑 可 以 用 来 表示 复杂 的 事实 。 由 于 有 了 悠久 
历史 的 理论 逻辑 的 支持 ， 谓 词 逻辑 成 为 一 门 
良好 定义 的 语言 。 这 一 节 我 们 先 介 绍 简单 一 
些 的 语言 一 一 命题 逻辑 ， 然 后 再 介绍 谓词 敢 





辑 。 谓 词 逻 辑 使 用 了 命题 逻辑 。 图 18-2 ”代表 语义 网 的 框架 组 
1. 命题 逻辑 
命题 逻辑 是 由 对 世界 进行 逻辑 推理 的 一 组 句子 组 成 的 一 种 语言 。 
运算 符 
命题 逻辑 使 用 5 种 运算 符 ， 如 下 所 示 : 
一 V 人 a 《一 
( 非 ) (或 ) “与 ) ” (如 果 …… 那 么 ) ( 当 且 仅 当 ) 


第 一 个 运算 符 是 一 元 运算 符 (运算 符 带 一 个 句子 )， 其 他 4 个 都 是 二 元 运算 符 (运算 符 带 
两 个 句子 )。 每 个 句子 的 逻辑 值 ( 真 或 假 ) 取决 于 原子 句子 的 逻辑 值 ， 原 子 句 子 是 不 带 运算 
符 的 构成 复杂 句子 的 特殊 句子 。 图 18-3 显示 了 命题 逻辑 中 每 个 运算 符 的 真 值 表 。 真 值 表 在 
第 4 章 中 介绍 过 ， 在 附录 了 中 有 解释 。 





句子 
这 种 语言 中 的 句子 递归 定义 如 下 : 

1 ) 大 写字 母 (如 A、B、S 或 T) 表示 在 自然 语言 中 的 一 个 语句 ， 它 们 是 一 个 句子 。 
2 ) 两 个 常数 值 ( 真 和 假 ) 中 的 任意 一 个 都 是 句子 。 

3 ) 如 果 P 是 句子 ， 则 一 P 了 也 是 句子 。 

4 ) 如 果 P 和 QQ 是 句子 , 则 PVQ、PAQ、P 一 Q 和 PQ 都 是 句子 。 
以 下 的 是 命题 语言 中 的 句子 ， 

a. 今天 是 星期 天 (S )。 

b. 天 在 下 雨 (R)。 

c. 今天 是 星期 天 或 者 是 星期 一 (S V M)。 

d. 天 没 下 雨 (一 R)。 

e. 如 果 狗 是 哺乳 动物 ， 那 么 猪 也 是 哺乳 动物 (D 一 C)。 


i 





推演 

在 人 工 智 能 中 ， 我 们 需要 从 已 知 的 事实 中 推导 出 新 的 事实 。 在 命题 逻辑 中 ， 这 样 的 过 程 
称 为 推演 。 给 定 两 个 假定 为 真 的 句子 ， 我 们 能 推演 出 新 的 为 真 的 句子 ， 前 面 两 个 句子 称 为 前 
提 ， 推 演出 的 句子 称 为 结论 ， 而 整个 称 为 论断 。 例 如 : 


前 提 1: 他 或 者 在 家 或 者 在 办 公 室 
前 提 2: 他 不 在 家 
结论 所 以 ， 他 在 办 公 室 


如 果 我 们 用 互 代 表 “ 他 在 家 "，0 代表 “他 在 办 公 室 ”， 符 号 |- 代表 “所 以 ”， 那 上 面 的 
论断 可 以 表示 成 
{H VY 0, —H}|I- 0 


问题 是 我 们 如 何 证 明 推演 的 论断 是 合法 的 。 一 个 合法 的 论断 是 指 它 的 结论 是 前 提 的 必然 
延续 。 换 言 之 ， 在 一 个 合法 的 推演 论断 中 ， Fe 而 结论 为 假 ， 这 是 不 可 


能 的 。 
验证 论断 合法 性 的 一 一 种 方法 是 为 前 提 和 结论 建立 真 值 表 。 如 果 我 们 在 其 中 发 现 了 反例 ， 
ee. 反例 就 像 : 所 有 的 前 提 都 为 真 ， 而 结论 却 是 假 。 
论断 {HVO， 国门 9 的 合法 性 可 以 用 如 下 的 真 值 表 证 明 ， 


OK 





上 表 中 唯一 要 检查 的 行 是 第 二 行 ， 这 一 行 没有 显示 反例 ， 因 此 ， 论断 是 合法 的 。 有 些 论 
断 在 逻辑 上 是 非法 的 ， 例 如 : 


前 提 1; 如 果 她 富有 ， 她 有 车 

前 提 2: 她 有 车 

结论 因此 ， 她 富有 

我 们 可 以 看 到 ， 即 使 前 两 个 句子 都 为 真 ， 结 论 却 是 假 。 我 们 把 上 面 的 论断 表示 成 : 
Pe Cj}|-R， 其 中 及 代表 “她 富有 "，C 代表 “她 有 车 ”。 

论断 {R 一 C，C}|-R 是 非法 的 ， 是 因为 能 找到 反例 。 





Ee es 
F 下 
F F 
T T 
T T 
结论 


上 表 中 第 2 行 和 第 4 行 需要 检查 。 虽 然 第 4 行 没 问题 ， 但 第 2 行 显示 了 反例 (两 个 真 的 
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前 提 导致 假 的 结论 )。 因 此 ， 这 个 论断 是 非法 的 。 
。 ” 当 找 不 到 反例 时 ， 论 断 就 是 合法 的 。 

2. 谓词 逻辑 

在 命题 逻辑 中 ， 表 示 句 子 的 符号 是 原子 的 ， 我 们 不 能 分 割 开 它 而 发 现 各 个 组 成 部 分 中 所 
含 的 信息 。 例 如 ， 如 下 这 样 的 句子 ; 

Pi: “ 球 达 是 玛丽 的 母亲 ” P2: “玛丽 是 安妮 的 母亲 ” 


我 们 可 以 用 很 多 方法 来 组 合 这 两 个 句子 ， 从 而 产生 其 他 的 句子 。 但 却 不 能 抽取 出 琳 达 和 
安妮 间 的 任何 关系 。 例 如 ， 我 们 不 能 从 上 面 两 个 句子 中 推导 出 琳 达 是 安妮 的 祖母 。 要 进行 这 
样 的 推导 ， 我 们 就 需要 谓词 逻辑 。 这 种 逻辑 定义 了 命题 各 部 分 间 的 关系 。 

在 谓词 逻辑 中 ， 句 子 被 分 成 谓词 和 参数 。 例 如， 如 下 的 句子 被 写成 了 谓词 带 两 个 参数 的 
形式 : 

Pi: “ 琳 达 是 玛丽 的 母亲 ” 变 成 母亲 ( 琳 达 ， 玛 丽 ) 

Pz: “玛丽 是 安妮 的 母亲 ” 变 成 母亲 (玛丽 ， 安 妮 ) 

上 面 句子 中 的 母亲 关系 是 由 谓词 “母亲 ”来 定义 的 ， 如 果 在 两 个 句子 中 的 玛丽 是 指 同 一 
个 人 ,我们 可 以 推导 出 琳 达 和 安妮 间 的 新 的 关系 : 祖母 ( 琳 达 ， 安 妮 )。 这 就 是 谓词 逻辑 的 
全 部 意图 。 

句子 

谓词 逻辑 语言 中 的 句子 定义 如 下 : 

1 ) 一 个 带 有 nn 个 参数 的 谓词 ， 像 predicate name(argumenti,…… argument,) 是 一 个 句子 ， 
predicate_name 把 各 个 参数 关联 起 来 。 每 个 参数 可 以 是 : 

a. 一 个 常数 ,， 像 人 类 、 动 物 、 约 翰 、 玛 丽 。 

b. 一 个 变量 , 像 x、y 和 z。 

c. 一 个 函数 ， 像 母亲 (安妮 )。 注 意 ， 函 数 是 谓词 ， 可 以 用 作 参 数 ， 函 数 的 返回 对 象 能 

蔡 代 参数 。 

2 ) 两 个 常数 值 ( 真 和 假 ) 中 的 任 一 个 都 是 句子 。 

3 ) 如 果 P 是 句子 ， 则 一 了 也 是 句子 。 

4) 如 果 P 和 Q 是 句子 , 则 PYVQ、P 和 A 人 Q、P 一 Q 和 PQ 都 是 句子 。 

例 .18-4 

1 ) 句子 “John works for Ann's sister” 可 以 被 写成 ; 

works [John, sister (Ann)] 

其 中 函数 sister(Ann) 用 作 人 参数 。 

2 ) 句子 “John's father loves Ann s sister” 可 以 写成 ; 

loves[father (John) ,sister (Ann)] 

量词 

谓词 逻辑 允许 使 用 量词 。 在 谓词 逻辑 中 两 个 常用 的 量词 是 Y 和 3 了 。 

1 ) 第 一 个 词 ,“V” 读 成 “所 有 的 ”， 被 称 为 全 称 量 词 ， 它 表明 变量 所 表示 的 全 部 对 象 


茶 些 事 为 真 。 
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2 ) 第 二 个 词 ,“ 习 ” 读 成 “存在 "， 被 称 为 存在 量词 ， 它 表明 变量 所 表示 的 一 个 或 多 个 


对 象 某 些 事 为 真 。 
下 面 显 示 英 语 中 的 句子 如 何 被 写成 谓词 逻辑 中 的 句子 (x 是 占 位 符 ): 


1 ) 句子 “All men are mortals ”可 以 写成 . 


Vx[man(x) — mortal (x)] 


2 ) 句子 “Frogs are green ”可 以 写成 ; 


Vx[frog(x) — green (x)) 





因为 句子 可 以 写成 “All frogs are green” 或 “Any frog are green”。 所 以 谓词 “greenness” 
可 以 应 用 于 所 有 的 frog (青蛙 ) 上 。 
3 ) 句子 “Some flowers are red” 可 以 写成 ; 
Jx[flower (x) 人 red (x)] 


注意 ， 插 号 中 的 运算 符 “ 人 入 ” 民 兰 了 “一 ”"， 这 样 做 的 原因 超出 了 本 书 的 范围 。 
4 ) 句子 “John has a book” 可 以 写成 ， 


Ix[book (x) A has (John,x) ] 


换言之 ， 句 子 变 成 了 “There exist a book that belongs to John”。 
5 ) 句子 “No frog is yellow” 可 以 写成 ; 


VY x[frog(x) 一 一 yellow(x)] 或 一 jx[frog(x) 人 yellow (x)] 


意思 是 : 不 存在 一 只 青蛙 且 是 黄色 的 。 

推演 | 

在 谓词 逻辑 中 ， 如 果 没 有 量词 ， 一 个 论断 的 真 假 确认 与 命题 逻辑 完全 相同 。 但 是 ， 当 有 
量词 时 ,判断 就 变 得 复杂 多 了 。 例如， 下 面 的 论断 是 完全 合法 的 。 


前 提 1: All men are mortals 
前 提 2; Socrates is a man 
结论 Therefore, Socrates is mortal. 


判断 这 个 简单 的 论断 并 不 复杂 。 我 们 可 以 写成 : 


Vx{[man(x) 一 mortal (x) ] ,man (Socrates) |- mortal (Socrates) 


既然 第 一 个 前 提 是 讨论 所 有 的 人 ， 我 们 可 以 把 这 个 类 中 的 一 个 实例 ( Socrates) 放 到 前 
提 中 ， 就 得 到 如 下 的 论断 ， 

man (Socrates) 一 Imortal (Socrates) ,man(Socrates) |- mortal (Socrates) 

这 可 简化 成 M 一 Mz，M |- Mz。 这 里 Mi 是 man(Socrates)，M; 是 mortal(Socrates)。 这 
个 结果 是 命题 逻辑 中 的 一 个 论断 ， 显 然 是 合法 的 。 但 是 ， 在 谓词 逻辑 中 有 许多 论断 不 像 这 样 
容易 判别 ， 我 们 需要 一 套 系统 的 证 明 ， 但 这 超出 了 本 书 的 范围 。 


3. 超 谓词 逻辑 
由 于 逻辑 推理 的 需要 ， 逻 辑 得 到 了 进一步 的 发 展 ， 这 些 包 括 高 阶 逻辑 、 黑 认 逻 辑 、 模 态 


逻辑 和 时 态 有 逻辑 。 这 里 只 是 简单 地 罗列 一 下 这 些 名 词 。 对 它们 的 讨论 超出 了 本 书 的 范围 。 


高 阶 逻 辑 
高 阶 远 辑 扩展 了 谓词 逻辑 中 量词 Y 和 3 的 范围 。 这 些 谓 词 逻 辑 中 的 量词 把 变量 x 和 ? 绑 
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定 到 实例 (在 初始 化 时 )。 在 高 阶 逻 辑 中 我 们 能 使 用 量词 捆绑 那些 代表 属性 和 关系 的 变量 。 
这 样 ， 在 初始 化 的 过 程 中 ， 这 些 变量 就 被 换 成 了 谓词 。 例 如 ， 我 们 可 以 有 : P(Pj 八 P,)， 下 标 
j 和 a 表示 John 和 Anne， 这 意味 着 John 和 Anne 具有 完全 相同 的 属性 。 

模 态 逻辑 

逻辑 的 一 个 快速 发 展 的 趋势 是 模 态 逻辑 。 逻 辑 中 包含 了 “could ”“should ”may ”might 
“ought” 等 这 样 的 表达 式 ， 来 表达 句子 中 语法 上 的 语气 。 在 这 样 的 逻辑 中 ， 我 们 有 符号 表示 
“it is possible that” 这 样 的 运算 符 。 

时 态 逻 辑 

时 态 逻 辑 像 模 态 逻辑 一 样 ， 用 一 套 时 态 运算 符 扩 展 了 谓词 逻辑 ， 如 “from now on ”或 
者 “at some point in time”， 它 们 包含 了 论断 合法 性 中 的 时 间 因 素 。 

默认 逻辑 

在 默认 逻辑 中 ， 我 们 假定 论断 的 默认 结论 可 以 被 接收 ， 只 要 论断 与 知识 库 中 的 内 容 相 一 
致 即 可 。 例 如 ， 我 们 假定 所 有 的 鸟 都 会 飞 ， 除 非 知识 库 中 有 内 容 废除 了 这 条 通用 的 事实 。 


18.2.4 基于 规则 的 系统 

基于 规则 的 系统 使 用 一 组 规则 来 表示 知识 ， 这 些 规则 能 用 来 从 已 知 的 事实 中 推导 出 新 的 
事实 。 规 则 表示 当 指 定 条 件 满足 时 什么 为 真 。 基 于 规则 的 数据 库 是 一 组 if…then… 语 名 ， 它 
们 的 形式 为 : 

if A then B 或 RAR 一 B 

其 中 A 称 为 前 提 ，B 为 结论 。 注 意 在 基于 规则 的 系统 中 ， 每 条 规则 都 是 独立 处 理 的 ， 


与 其 他 规则 没有 关联 。 

1. 组 成 z 

一 个 基于 规则 的 系统 由 三 部 分 构成 : 解释 器 (或 推理 机 )、 知 识 库 和 事实 库 ， 如 图 18-4 
所 示 。 

知识 库 

基于 规则 系统 中 的 知识 库 部 分 就 是 规则 的 数据 库 
(仓库 )。 它 包含 一 组 预先 建立 的 规则 ， 这 些 规 则 能 从 给 
定 事实 中 得 出 结论 。 

事实 库 

事实 库 中 包含 了 知识 库 中 的 规则 要 使 用 的 一 组 条 件 。 图 18-4 基于 规则 的 系统 的 组 成 部 分 

解释 器 

解释 器 (推理 机 ) 是 一 个 处 理 器 或 控制 器 (如 一 段 程序 )， 它 把 规则 和 事实 组 合 在 一 起 。 
解释 器 有 两 种 类 型 ; 正 向 推理 和 反 向 推理 。 我 们 将 简单 描述 它们 。 

2. 正 向 推理 

正 向 推理 是 这 样 一 个 过 程 ， 解 释 器 使 用 一 组 规则 和 一 组 事实 来 执行 一 个 行动 。 这 个 行动 
可 能 是 向 事实 库 中 增加 一 条 新 的 事实 ， 或 处 理 其 他 一 些 命令 ， 如 开启 男 一 个 程序 或 机 器 。 解 
释 器 解释 和 执行 规则 ， 直 到 不 再 有 要 解释 的 规则 。 图 18-5 显示 了 基本 的 算法 。 

如 果 系 统 中 有 任何 冲突 发 生 ， 冲 突 是 指 有 两 条 不 同 的 规则 可 以 应 用 到 一 个 事实 上 ， 或 一 
条 规则 可 以 应 用 到 两 个 事实 上 ， 这 时 系统 就 要 调用 冲突 处 理 过 程 来 解决 这 个 问题 。 这 就 保证 





人 工 知 能 339 





本 只 有 一 个 输出 能 被 加 到 事实 库 中 或 一 个 行动 被 采取 。 关 于 冲突 处 理 的 讨论 比较 复杂 ， 超 出 


了 本 书 的 范围 。 

3. 反问 推理 

如 果 系 统 是 证 明 一 个 结论 ， 那 么 正 向 推理 效率 不 高 。 面 对 给 出 的 结论 ， 所 有 的 规则 检查 
所 有 的 事实 。 这 种 情况 下 ， 如 果 使 用 反 向 推理 ， 效 率 会 高 些 。 图 18-6 显示 了 反 向 推理 的 过 程 。 





查找 可 以 被 
满足 的 所 有 规则 





尝试 验证 这 条 


规则 中 的 每 个 事实 





该 规则 的 动作 


图 18-5 正 向 推理 的 流程 图 图 18-6 反 向 推理 的 流程 图 


过 程 从 一 个 结论 (目标 ) 开始 ， 如 果 目 标 已 在 事实 库 中 ， 则 过 程 停 止 ， 结 论 得 到 验证 。 
如 末 结 论 不 在 事实 库 中 ,那么 系统 查找 目标 在 规则 结论 中 的 规则 。 但 是 ， 反 向 推理 不 是 触发 
这 条 规则 ， 而 是 去 验证 这 条 规则 中 的 每 个 事实 (递归 )。 如 果 这 条 规则 中 的 所 有 事实 都 在 事 
实 库 中 ， 那 么 原来 的 目标 就 得 到 验证 。 


18.3 专家 系统 

专家 系统 使 用 前 面 所 讨论 的 知识 表示 语言 ， 来 执行 通常 需要 人 类 专家 才能 完成 的 任务 。 
它们 被 用 在 需要 人 类 专家 ， 而 人 类 专家 却 缺 少 、 昂 贵 或 不 可 用 等 场合 。 例 如 ， 在 医疗 领域 ， 
可 建立 专家 系统 从 一 组 症状 中 得 到 可 能 病因 的 子 集 ， 而 这 项 任务 通常 是 由 医生 来 进行 的 。 


18.3.1 抽取 知识 


一 个 专家 系统 是 建立 在 预先 定义 的 关于 领域 专家 经 验 的 知识 的 基础 上 的 。 例 如 ， 医 疗 专 
家 系统 是 建立 在 有 经 验 的 医生 所 具有 的 知识 的 基础 上 的 ， 而 这 些 有 经 验 的 医生 是 专攻 这 些 领 
域 的 专家 。 因 此 ， 建 立 专家 系统 的 第 一 步 就 是 从 人 类 专家 身上 抽取 知识 。 抽 取 的 知识 就 变 成 
了 我 们 前 面 讲 到 的 知识 库 。 

从 专家 身上 抽取 知识 通常 是 困难 的 ， 这 有 几 个 原因 

1 ) 专家 拥有 的 知识 通常 是 启发 式 的， 它们 是 基于 概率 的 ， 而 不 是 确定 的 。 
2 ) 专家 常常 发 现 用 可 以 存放 在 知识 库 中 的 规则 形式 来 描述 知识 是 艰难 的 。 例 如 ， 要 一 步 一 

步 地 显示 故障 电动 机 是 如 何 被 诊断 的 ， 这 对 电气 工程 师 来 说 是 非常 艰难 的 。 知 识 常常 是 直觉 的 。 

3 ) 知识 获取 只 能 通过 与 专家 个 人 会 面 才能 进行 。 如 果 会 面 者 对 这 种 会 面 并 不 擅长 ， 那 


么 会 面 将 是 累 人 的 和 枯燥 的 。 
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知识 抽取 过 程 通常 是 由 知识 工程 师 来 完成 。 他 可 能 并 不 是 此 领域 的 专家 ， 但 他 有 经 验 ， 
知道 如 何 去 会 面 ， 如 何 去 解 释 答案 ， 所 有 这 些 工程 师 能 用 来 建立 知识 库 。 


18.3.2 ”抽取 事实 


为 了 能 推导 新 的 事实 或 采取 动作 ， 除 了 需要 用 知识 表示 语言 表示 的 知识 库 外 ， 还 需要 事 
实 库 。 专 家 系统 中 的 事实 库 是 基于 事例 的 ， 在 事例 中 事实 被 收集 或 度量 ， 然 后 进入 系统 ， 被 


推理 机 使 用 。 


18.3.3 体系 结构 


图 18-7 显示 了 一 个 专家 系统 体系 结构 背后 的 通常 理念 。 如 图 所 示 ， 一 个 专家 系统 有 7 
个 部 分 构成 : 用 户 、 用 户 界 面 、 推 理 机 、 知 识 库 、 事 实 库 、 解 释 系统 和 知识 库 编 辑 器 。 


专家 系统 外 充 





图 18-7 专家 系统 体系 结构 


推理 机 是 专家 系统 的 心脏 ， 它 与 知识 库 、 事 实 库 和 用 户 界面 进行 通信 。 专 家 系统 中 7 个 
部 分 中 的 4 个 (用户 界面 、 推 理 机 、 解 释 系统 和 知识 库 编 辑 器 ) 是 能 一 次 建造 ， 为 多 个 应 用 
使 用 的 ， 因 为 它们 并 不 依赖 于 特殊 的 知识 库 或 事实 库 。 图 中 这 些 部 分 显示 在 一 个 有 阴影 的 方 
框 中 ， 通 常 它们 被 称 为 专家 系统 外 壳 。 

1. 用户 

用 户 是 使 用 系统 ， 从 所 提供 的 专家 经 验 中 获 益 的 实体 。 


2. 用 户 界面 
用 户 界面 允许 用 户 与 系统 交互 ， 用 户 界面 能 接收 用 户 的 自然 语言 ， 然 后 把 它们 翻译 给 系 


统 。 大 多 数 用 户 界面 提供 用 户 友 好 的 菜单 系统 。 
3. 推理 机 
推理 机 是 专家 系统 的 心 胜 ， 它 使 用 知识 库 和 事实 库 推 导出 要 采取 的 动作 。 
4. 知识 库 
知识 库 是 基于 与 相关 领域 专家 的 会 面 而 得 到 的 知识 的 集合 。 


5. 事实 库 
事实 库 在 专家 系统 中 是 基于 事例 的 。 对 于 每 个 事例 ， 用 户 输入 可 用 的 或 度量 的 数据 进 人 
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事实 库 ， 推 理 机 为 这 特殊 的 事例 使 用 这 些 数据 。 
6. 解释 系统 
并 不 是 所 有 的 专家 系统 都 有 解释 系统 ， 它 用 来 解释 推理 机 得 出 的 结论 的 合理 性 。 
7. 知识 库 编 辑 器 
并 不 是 所 有 的 专家 系统 都 有 知识 库 编 辑 器 ， 当 从 领域 专家 那里 获得 新 的 经 验 时 ， 用 知识 


库 编辑 器 来 更 新 知识 库 。 


18.4 ”感知 

人 工 智 能 的 一 个 目标 是 创建 一 台 行 为 像 专家 的 机 器 一 一 专家 系统 。 另 外 一 个 目标 是 创建 
一 台 行 为 像 普通 人 的 机 器 。“ 感 知 ” 这 个 词 的 一 个 意思 是 理解 通过 感官 (视觉 、 听 觉 、 触 觉 、 
嗅觉 、 味 觉 ) 接收 到 了 什么 。 人 类 通过 眼睛 看 风景 ， 头 脑 把 它 解释 成 在 风景 中 抽取 出 来 的 对 
象 类 型 。 人 类 通过 耳 洒 听 到 一 组 声音 信号 ， 头 脑 把 它 解释 成 有 意思 的 句子 ， 等 等 。 

如 果 一 个 智能 体 要 表现 得 像 人 类 ， 那 它 就 应 该 有 感知 能 力 。 人 工 智能 已 经 初步 完成 两 种 
感知 : 视觉 和 听觉 。 虽 然 其 他 的 感知 可 能 在 未 来 会 被 实现 ， 但 本 节 将 简要 讨论 这 两 个 领域 的 
研究 。 


18.4.1 图 像 处 理 


图 像 处 理 或 计算 机 视觉 是 人 工 智能 的 一 个 研究 领域 ， 它 处 理 通过 像 摄像 机 这 样 的 智能 体 
的 人 工 眼睛 而 获得 的 对 对 象 的 感知 。 一 个 图 像 处 理 器 从 外 部 世界 获得 二 维 图 像 ， 然 后 创建 在 
场景 中 的 这 个 对 象 的 三 维 描述 。 虽然 ， 这 对 人 类 3 
来 说 是 容易 的 事情 ， 但 对 智能 体 来 说 却 是 困难 的 
事情 。 图 像 处 理 器 的 输入 是 一 幅 或 多 幅 场景 图 像 
而 得 到 的 输出 是 场景 中 对 象 的 描述 。 处 理 器 使 用 
了 一 个 含有 对 象 比较 特性 的 数据 库 (图 18-8 )。 

我 们 需要 强调 的 是 ， 图 像 的 获取 是 通过 使 用 。 数据 库 Re 
摄影 和 电视 技术 来 创建 图 像 的 。 人 工 智 能 关心 的 图 18-8 图 像 处 理 器 的 组 成 部 分 
是 如 何 解释 这 些 图 像 ， 并 从 中 抽取 出 对 象 的 特征 。 

1. 边缘 探测 

图 像 处 理 的 第 一 步 是 边缘 探测 ， 去 查找 图 像 中 的 边缘 在 哪里 。 边 缘 定 义 了 图 像 中 的 对 象 
和 背景 间 的 边界 。 假 定 没有 伪装 存在 时 ， 通 常 属于 对 象 的 表面 和 环境 间 是 存在 着 明显 的 反差 
的 。 边 缘 显示 了 在 表面 、 深 度 或 亮度 方面 的 连续 性 。 例 如 ， 图 18-9 显示 了 一 个 非常 简单 的 
图 像 和 用 0~9 表示 的 像素 点 的 亮度 值 。 这 里 0 表示 黑 ，9 表示 白 。 使 用 亮度 较 大 的 差异 什 
去 查找 邻接 像素 点 ， 就 能 找到 边缘 。 

这 里 有 几 种 数学 方法 ， 利 用 像素 点 的 亮度 值 
从 背景 中 找到 对 象 的 边界 。 最 简单 的 一 种 方法 是 
分 异 亮度 矩阵 。 具 有 一 致 亮度 值 的 区 域 将 产生 比 
较 低 的 分 异 值 (0 或 1 )， 而 边缘 将 产生 最 大 的 分 
异 值 。 关 于 这 些 方法 的 讨论 超出 了 本 书 的 范围。 人 
cn 以 便 进一步 的 六 
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2. 分 段 
分 段 是 图 像 分 析 接 下 来 的 一 步 。 分 段 把 图 像 分 成 同 构 的 段 或 区 域 。 同 构 的 定义 随 着 方法 


的 不 同 而 不 同 。 但 是 ， 通 常 同 构 的 区 域 是 其 中 像素 点 亮度 值 变化 平滑 的 区 域 。 分 段 与 边缘 探 
测 非常 类 似 。 在 边缘 探测 中 ， 对 象 的 边缘 和 背景 被 找到 。 在 分 段 中 ， 对 象 中 两 个 不 同 区 域 的 
边界 被 找到 。 经 过 分 跋 后 ， 对 象 被 分 成 不 同 的 区 域 。 

有 几 种 方法 进行 分 段 。 有 一 种 称 为 阅 值 化 ， 它 把 指定 亮度 值 的 像 豪 点 选择 出 来 ， 试 图 去 
发 现 所 有 具有 相同 或 非常 相近 亮度 值 的 像素 点 。 通 过 这 种 方法 找到 的 像素 点 形成 了 一 个 段 。 
另外 一 种 方法 称 为 分 割 ， 分割 选取 一 个 非 同 构 的 区 域 ， 把 它 分 成 同 构 的 区 域 。 还 有 一 种 方法 
称 为 合并 ， 它 用 来 进行 具有 相同 亮度 值 区 域 的 合并 。 


3. 查找 深度 
图 像 分 析 接 下 来 的 一 步 是 查找 对 象 的 深度 或 是 图 像 中 的 对 象 。 深 度 的 查找 可 以 帮助 智能 


体 去 测量 对 象 距 它 多 远 。 有 两 种 常用 的 方法 : 立体 视觉 和 运动 。 

立体 视觉 

立体 视觉 (有 时 称 为 立体 影像 ) 使 用 人 类 眼睛 的 技术 来 发 现 对 象 的 深度 。 为 了 得 到 准确 
的 距离 识别 ， 人 类 要 使 用 两 只 眼睛 。 如 果 对 象 靠 得 非 常 近 ， 我 们 眼睛 里 创建 的 两 幅 图 像 是 不 
同 的 ; 但 如 果 对 象 很 远 ， 则 这 两 幅 图 像 几乎 是 相同 的 。 无 须 经 过 数学 的 计算 和 证 明 ， 我 们 就 
可 以 说 识别 对 象 距 离 的 一 种 工具 就 是 两 只 眼睛 或 两 台 摄像 机 。 两 台 摄像 机 创建 的 图 像 能 帮助 
智能 体 去 判定 对 象 是 近 还 是 远 。 

运动 

另外 一 种 对 发 现 图 像 中 的 对 象 距离 有 帮助 的 方法 是 ; 当 图 中 一 个 或 多 个 对 象 移动 时 建立 
多 幅 图 像 。 在 场景 中 移动 对 象 与 其 他 对 象 间 的 相对 位 置 能 给 出 对 象 距离 的 提示 。 人 例如， 假定 
一 段 视频 显示 了 一 个 人 在 房子 前 的 移动 。 人 和 房子 ( 近 距 离 对 象 ) 的 相对 位 置 会 改变 ， 但 人 
和 远 处 的 山 间 的 相对 位 置 却 不 会 变 。 智 能 体 就 能 得 出 结论 : 房子 在 近 处 ， 而 山 在 远 处 。 

4. 查找 方向 ; 

场景 中 对 象 的 方向 可 以 使 用 两 种 技术 来 发 现 : 光照 和 纹理 。 

光照 


光 从 物体 表面 反射 的 总 量 由 多 个 因素 来 决定 。 如 何 一 
个 对 象 的 不 同 表面 的 光学 特性 是 相同 的 ， 那 么 反射 光线 的 
总 量 将 取决 于 反射 光源 的 物体 表面 ( 它 的 相对 位 置 ) 的 方 


向 。 图 18-10 显示 了 两 个 被 画 出 的 对 象 。 有 阴影 的 对 象 诸 ”图 18-10 方向 查找 中 光照 的 影响 
无 疑问 更 准确 地 显示 了 对 象 表面 的 方向 。 

纹理 

纹理 (有 规律 重复 的 图 案 ) 也 能 对 查找 方向 或 表面 的 曲率 有 所 帮助 。 如 果 智 能 体能 识别 
图 案 , 这 将 帮助 它 查找 对 象 的 方向 或 曲率 。 

5. 对 象 识别 

图 像 处 理 的 最 后 一 步 是 对 象 识别 。 要 识别 对 象 ， 智 能 体 需要 在 它 的 记忆 里 有 可 进行 比较 
的 对 象 模型 。 但 是 ， 把 所 见 的 每 个 对 象 模型 都 进行 创建 和 存储 是 一 个 不 可 能 的 任务 。 一 个 解 
决 方案 是 假定 要 识别 的 对 象 是 一 个 复合 的 对 象 ， 它 由 一 组 简单 的 几何 形状 体 组 成 。 这 些 原始 
的 形状 能 在 智能 体 的 记忆 中 创建 并 存储 。 我 们 需要 智能 体 识别 的 对 象 类 型 能 用 这 些 对 象 的 组 


合 创建 出 来 并 保存 起 来 。 
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当 智 能 体 “ 看 ”到 对 象 ， 它 就 进行 对 象 的 分 解 ， 把 对 象 分 解 成 原始 形状 的 组 合 。 如 
果 组 合 的 对 象 对 智能 体 来 说 是 已 知 的 ， 那 对 象 就 被 识别 了 。 图 18-11 显示 了 一 小 部 分 原始 
几何 形状 。 


,EE 
长 方 体 圆柱 体 圆锥 体 截 锥 体 棱锥 体 戴 棱 锥 体 


18-11 原始 几何 形状 





6. 应 用 
图 像 处 理 的 一 个 应 用 领域 是 制造 业 ， 特 别 是 在 组 装 生 产 线 上 。 一 个 具有 图 像 处 理 能 力 的 


机 器 人 能 用 来 测定 组 装 生产 线 上 的 对 象 的 位 置 。 在 这 样 的 环境 下 ， 需 要 感知 的 对 象 数目 是 有 
限 的 ， 所 以 ,图像 处 理 就 变 得 非常 有 帮助 。 


18.4.2 语言 理解 


人 类 一 个 固有 的 能 力 是 能 理解 ( 即 解释 ) 所 感知 的 声音 信和 号。 一 台 能 理解 自然 语言 的 机 
器 在 日 常生 活 中 是 非常 有 用 的 。 例 如 ， 它 能 替代 电话 操作 员 (在 大 部 分 时 间 里 )。 它 还 可 以 
用 在 系统 需要 预先 定义 格式 查询 的 场合 。 例 如 ， 送 到 数据 库 的 查询 必须 遵循 指定 系统 所 用 的 
格式 。 能 够 理解 自然 语言 中 的 查询 ， 然 后 把 它们 翻译 成 指定 格式 的 机 器 是 非常 有 用 的 。 

机 器 理解 自然 语言 的 任务 分 成 4 个 连续 的 步骤 : 语音 识别 、 语 法 分 析 、 语 义 分 析 和 语 用 
分 析 。 


1. 语音 识别 
自然 语言 处 理 的 第 一 步 是 语音 识别 。 在 这 一 步 中 ， 语 音信 号 被 分 析 ， 其 中 所 含 的 单词 序 


列 被 抽取 出 来 。 语 音 识 别 子 系统 的 输入 是 连续 (模拟 ) 的 信号 ， 输 出 是 单词 的 序列 。 信 号 需 
要 被 分 割 成 不 同 的 声音 ， 有 时 称 为 音素 ， 而 声音 还 需要 组 合 到 单词 中 。 但 是 ， 这 些 详 细 的 过 
程 超出 了 本 书 的 范围 。 我 们 把 这 些 问 题 留 给 专门 介绍 语音 识别 的 书 。 

2. 语法 分 析 : 

语法 分 析 这 一 步 用 来 定义 单词 在 句子 中 是 如 何 组 织 的 ， 这 对 于 像 英 语 这 样 的 语言 是 非 
常 困难 的 任务 。 因 为 单词 在 句子 的 作用 并 不 是 由 它 在 句 中 的 位 置 决定 的 。 例 如 ， 下 面 两 个 
句子 : 


Mary rewarded John . 
John was rewarded by Mary. 


这 两 个 句子 中 John 都 是 受到 奖励 的 ， 但 在 第 一 个 句子 中 ，John 在 最 后 的 位 置 ， 而 Mary 
在 第 一 个 位 置 。 一 台 机 器 在 听 到 上 面 任 一 个 句子 时 都 要 能 正确 地 解释 ， 得 到 相同 的 结论 。 

文法 

正确 分 析 句 子 的 第 一 工具 是 良好 定义 的 文法 。 一 种 像 英 语 这 样 的 完全 成 熟 的 语言 具有 
非常 大 的 文法 规则 集合 。 我 们 假定 一 个 非常 小 的 英语 子 集 ， 定 义 非常 小 的 规则 集合 来 说 明 
观点 。 

语言 的 文法 定义 可 以 使 用 多 种 方法 : 我 们 使 用 BNF ( Backus-Naur 范式 ) 的 一 个 简单 的 
版 本 。Backus-Naur 范式 被 用 在 计算 机 科学 中 ， 定 义 编程 语言 的 语法 ( 表 18-1 )。 


表 18-1 一 个 简单 文法 
序 号 规 则 
句子 一 名 词 短 语 动词 短语 
名 词 短语 名 词 | 冠 词 名词 | 冠 词 形容 词 名 词 
动词 短语 动词 | 动词 名词 短语 | 动词 “名词 短语 副词 


II liD | 一 


名 词 [home]l[cat]l[water]l[dog]l[John]l[Mary] 
冠 词 [a]l[the] 

形容 词 一 [big]l[smallj]i[tall]|[shortj|[white]l[black] 
动词 一 了 [goes]|[comes]l[eats]l[drinks]|[has]j/[lovesj] 


第 一 条 规则 定义 了 一 个 句子 是 一 个 名 词 短语 跟着 一 个 动词 短语 ， 第 二 条 规则 定义 了 名 
词 短 语 有 三 个 选择 : 单个 名 词 、 一 个 冠 词 跟 一 个 名 词 ， 或 者 一 个 冠 词 跟 一 个 形容 词 再 跟 一 个 
名 词 。 第 四 条 规则 明确 地 定义 了 什么 是 一 个 名 词 。 在 我 们 这 个 简单 的 语言 里 只 定义 了 7 个 名 
词 ， 而 在 像 英语 这 样 的 语言 里 名 词 表 是 在 词典 中 定义 的 。 第 六 条 规则 定义 了 形容 词 一 个 非常 
小 的 集合 。 第 七 条 规则 定义 了 动词 一 个 非常 小 的 集合 。 

虽然 我 们 的 语言 的 语法 非常 原始 ， 但 我 们 能 从 中 产生 许多 句子 ， 例 如 ， 我 们 有 : 


John comes home. 
Mary drinks water. 
John has a white dog. 
John loves Mary. 
Mary loves John. ‘ 


词法 分 析 器 

表 18-1 中 定义 了 简单 文法 ， 即 使 使 用 不 句子 
同 的 选项 ， 它 也 将 是 非常 清楚 的 。 一 台 判 定 i 
一 个 句子 是 否 符合 文法 (语法 ) 的 机 器 在 判 We 动词 短语 


定 一 个 句子 是 否 合法 之 前 ， 并 不 需要 检查 所 
有 可 能 的 选项 。 这 个 任务 是 由 词法 分 析 器 来 
完成 的 。 词 法 分 析 器 基于 文法 规则 建立 一 棵 | 冠 间 ”形容词 名词 
词法 分 析 树 来 判断 一 个 句子 的 合法 性 。 图 A end 
18-12 显示 了 句子 “ John has a white dog” 对 
应 的 词法 分 析 树 ， 该 句子 是 基于 表 18-1 中 定 
义 的 规则 产生 的 。 

3, 语义 分 析 

语义 分 析 就 是 在 句子 被 语法 分 析 之 后 抽取 出 句子 的 意思 。 这 种 分 析 建 立 了 句子 中 所 涉及 
的 对 象 的 表示 方法 、 它 们 的 关系 以 及 它们 的 属性 。 分 析 能 用 我 们 前 面 所 讨论 的 任 一 种 知识 表 
示 模 式 。 例 如 ， 句 子 “John has a dog” 可 以 用 谓词 逻辑 表示 成 ; 


Jx dog(x) has (John, x) 


4. 语 用 分 析 
前 面 的 三 个 步骤 (语音 识别 、 语 法 分 析 和 语义 分 析 ) 能 创建 口语 句子 的 知识 表示 。 在 大 


多 数 情 况 下 ， 另 外 一 步 ， 语 用 分 析 是 用 来 进一步 明确 句子 的 意图 和 消除 歧义 。 


名 词 ” ”动词 名 治 短 语 





a white dog 


图 18-12 ”对 句子 进行 词法 分 析 
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意图 

句子 的 意图 是 不 能 通过 上 面 的 三 个 步骤 发 现 的 。 例 如 ， 句 子 “Can you swim a mile?” 问 
的 是 听 者 的 能 力 ， 而 句子 “ Can you pass the salt? ” 却 只 是 一 句 礼 貌 的 请 求 。 英 语句 子 有 许多 
种 不 同 的 意图 ， 如 告诉 、 请 求 、 答 应 、 询 问 等 。 语 用 分 析 就 是 用 来 发 现 句 子 的 这 些 意图 的 。 

消除 歧义 

有 时 句子 在 语义 分 析 之 后 是 有 歧义 的 。 歧 义 的 出 现 有 不 同 的 情况 。 一 个 单词 可 能 有 不 目 
一 种 功能 ， 如 单词 “hard” 既 能 作 形 容 词 又 能 作 副 词 。 一 个 单词 可 能 有 不 止 一 种 的 意思 ， 如 
单词 “ball ”在 “football” 和 “ball room ”中 是 不 同 的 含义 。 两 个 单词 有 着 相同 的 发 音 ， 却 
有 着 不 同 的 拼写 和 含义 。 一 个 句子 在 语法 上 可 能 是 正确 的 ， 但 在 含义 上 却 是 没有 道理 的 。 例 
如 ， 句 子 “John ate the mountain ”语法 分 析 时 是 合法 的 ， 语 义 分 析 时 也 是 正确 的 ， 但 含义 却 
是 毫 无 道理 的 。 语 用 分 析 的 另外 一 个 目的 : 如 果 可 能 的 话 ， 从 句子 的 知识 表示 中 消除 歧义 。 


18.5 ”搜索 

人 工 智能 解决 问题 的 一 种 技术 是 搜索 ， 这 一 节 我 们 将 简单 地 讨论 这 种 技术 。 搜 索 可 以 描 
述 成 用 状态 (情形) 集合 求解 问题 。 搜 索 过 程 开 始 于 一 个 起 始 状态 ， 经 过 中 间 状 态 ， 最 后 到 
达 目 标 状态 。 例 如 ， 在 难题 求解 中 ， 初 始 状态 就 是 未 解决 的 难题 ， 中 间 状 态 就 是 对 难题 采取 
的 每 一 个 步骤 ， 目 标 状 态 就 是 难题 被 解决 时 的 情形 。 搜 索 过 程 所 使 用 的 全 部 状态 的 集合 称 为 
搜索 空间 。 

图 18-13 显示 了 一 个 具有 5 个 状态 的 状态 空间 的 例子 。 其 中 任 一 个 状态 都 可 能 是 初始 状 
态 或 目标 状态 。 带 箭头 的 线 显示 了 采取 合适 的 动作 后 ， 一 个 状态 是 如 何 从 一 个 状态 走 到 另 一 
个 状态 的 。 注 意 : 如 果 没 有 动作 或 动作 系列 可 被 采取 ， 那 么 从 一 个 状态 到 另 一 个 状态 的 转化 
也 许 就 是 不 可 能 的 。 \ 

一 个 显示 搜索 空间 的 难题 的 示 
例 是 著名 的 8 数字 游戏 ， 难 题 是 一 个 具有 9 个 
方 格 的 盘子 。 盘 子 中 只 有 8 个 方 格 ， 这 就 意味 
着 总 有 一 个 格子 是 空 的 。 方 格 被 打上 1 到 8 的 
数字 。 给 定 这 些 方 格 一 个 初始 随机 的 安排 ( 初 
始 状 态 )， 目 标 就 是 重新 安排 这 些 方 格 ， 直 至 
实现 方 格 的 有 序 排 列 (目标 状态 ) 。 游 戏 的 规 
则 是 一 个 方 格 能 滑 人 空 的 方 格 。 图 18-14 显示 
了 初始 和 目标 状态 的 一 个 实例 。 








一 种 可 能 的 初始 状态 一 种 可 能 的 目标 状态 
图 18-14 例 18-6 中 的 初始 状态 和 可 能 的 状态 


18.5.1 搜索 方法 
有 两 种 常用 的 搜索 方法 : 变 力 搜索 和 启发 式 搜索 。 蛮 力 搜 索 本 身 又 有 广度 优先 和 深度 优先 。 
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1. 蛮 力 搜索 
当 对 搜索 没有 任何 先 验 的 知识 时 ， 我 们 就 使 用 蛮 力 搜索 。 例 如 ， 在 图 18-15 中，A 和 T 


分 别 代表 起 点 和 终点 ， 我 们 要 在 迷宫 中 找到 从 A 到 工 的 路 。 迷 宫 的 树 形 图 如 图 18-16 所 示 。 
@ 
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图 18-15 用 来 展示 齐 力 搜索 的 迷 官 图 18-16 图 18-15 的 迷宫 对 应 的 树 
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广度 优先 搜索 
在 这 种 方法 中 ， 我 们 从 树 的 根 开 始 ， 在 我 们 走向 下 一 层 前 ， 检 查 当前 层 中 的 所 有 节点 。 


图 18-17 显示 了 迷宫 从 左 到 右 的 广度 优先 搜索 。 注 意 : 在 到 达 目 标 状态 前 ， 我 们 不 得 不 搜索 
所 有 的 节点 ， 所 以 这 种 方法 是 低 效 的 。 如 果 我 们 的 搜索 是 从 右 到 左 的 ， 那 么 我 们 要 搜索 的 节 


点 数 可 能 就 不 同 了 。 


第 1 层 _--*@ 
ep i 
第 2 层 了 <-B-—--—-—---—-—— ss CC-— 
第 3 层 ee ees es D ~ -一 一 二 一时 一 
a | | 
i 6------ 二 = 了 =- 
WA 
第 5 是 ee 
ea 
第 6 层 -=R-------N--Q--0--= 
/-\ 
第 7 层 -3-->(@ 


图 18-17 对 图 18-16 中 的 树 进行 广度 优先 搜索 


深度 优先 搜索 
在 这 种 方法 中 ， 我 们 从 树 的 根 开始 进行 向 前 搜索 ， 直 至 发 现 目 标 或 到 达 一 个 死 端 。 如 果 
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到 达 了 死 端 ， 我们 回溯 到 最 近 的 分 支 ， 然 后 再 次 向 前 搜索 。 我 们 继续 这 样 的 过 程 ， 直 至 达到 


目标 ( 见 图 18-18 )。 
图 18-18 显示 了 对 应 图 18-15 中 的 迷宫 从 右 开始 的 深度 优先 搜索 。 搜 索 路 径 ACFP 到 达 


了 一 个 死 端 ， 所 以 我 们 回溯 到 A 点 ， 继 续 沿 着 路 径 ABDG 搜索 ， 到 达 了 一 个 死 端 ， 回 淹 到 
B 点 ， 沿 着 路 径 BEIMO 搜索 ， 又 到 达 一 个 死 端 ， 回 溯 到 M 点 ， 沿 着 路 径 MQT 搜索 ， 我 们 
终于 到 达 了 目标 。 注 意 : 针对 迷宫 问题 ， 这 种 搜索 方法 的 效率 比 广度 优先 搜索 (图 18-17 ) 


要 高 。 
2. 局 发 式 搜索 
使 用 启发 式 搜 索 ， 我 们 给 每 个 节点 赋 一 个 称 为 启发 值 (h 值 ) 的 定量 值 。 这 个 定量 值 显 


示 了 该 节点 与 目标 节点 间 的 相对 远近 。 例 如 ， 考 虑 图 18-19 中 要 解决 的 8 数字 游戏 。 


A 
x SN 中 
7 
| /NR 

了 b 
图 18-18 对 图 18-16 中 的 树 进行 广度 优先 搜索 图 18-19 局 发 式 搜索 的 初始 和 目标 状态 


假定 难题 的 初始 和 目标 状态 如 图 所 示 。 每 一 个 方块 的 启发 值 是 它 到 目标 状态 要 移动 的 
最 小 步 数 。 每 个 状态 的 启发 值 是 这 个 状态 中 所 有 方块 的 启发 值 之 和 。 
表 18-2 显示 了 难题 的 初始 和 最 终 状 态 的 启发 值 。 


表 18-2 启发 值 
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开始 搜索 时 ， 我 们 考虑 下 一 层 所 有 可 能 的 状态 和 它们 
的 启发 值 。 对 于 我 们 的 难题 ， 一 步 移动 只 产生 两 个 可 能 的 
状态 ， 它 们 以 及 h 值 显示 在 图 18-20 中 。 

接 下 来 ， 我 们 从 具有 较 小 值 的 节点 开始 ， 画 出 下 一 
层次 可 能 的 状态 。 我 们 继续 这 种 方法 ， 直 至 到 达 一 个 h 值 | 国名 全 
为 0 (目标 状态 ) 的 状态 ， 就 像 图 18-21 中 显示 的 一 样 。 难 上 导 导 村 
题 的 解决 路 径 在 图 中 是 用 粗 箭头 表示 出 来 的 。 Te 
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图 18-21 8 迷宫 问题 的 启发 式 搜索 


18.6 ”神经 网 络 

如 果 智 能 体 应 该 表现 得 像 人 类 一 样 ， 那 么 它 可 能 需要 学 习 。 学 习 是 一 种 复杂 的 生物 现 
象 ， 即 使 是 人 类 自己 也 没有 完全 理解 。 要 使 人 工 智能 体 学 习 肯 定 不 是 件 容易 的 事情 。 但 是 ， 
在 过 去 已 经 有 好 几 种 方法 为 未 来 建立 了 希望 。 大 多 数 方法 使 用 了 归纳 学 习 或 从 例子 中 学 习 。 
这 意味 着 把 很 大 集合 的 问题 和 解法 都 给 计算 机 ， 让 计算 机 从 中 学 习 。 本 节 我 们 只 讨论 其 中 一 
种 方法 ， 它 可 以 不 必 使 用 复杂 的 数学 概念 来 描述 ， 它 就 是 神经 网 络 。 神 经 网 络 试图 使 用 神经 


元 网 络 去 模仿 人 脑 的 学 习 过 程 。 


18.6.1 生物 神经 元 


人 脑 中 有 数 以 亿 计 的 处 理 单元 ， 称 为 神 
经 元 。 每 个 神经 元 平均 与 数 以 千 计 的 其 他 神经 
元 相连 。 神 经 元 由 三 部 分 构成 : 胞 体 、 轴 突 和 轴 突 2 
树 突 。 如 图 18-22 所 示 。 树 突 于 (和 其 他 神经 元 的 连接 点 ) 


胞 体 〈 吴 体 ) 中 含有 细胞 核 : 它 是 处 理 器 。 图 18.22 神经 元 的 简化 图 


细胞 核 
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树 突起 到 输入 设备 的 作用 : 它 接收 其 他 神经 元 的 输入 。 轴 突起 到 输出 设备 的 作用 : 它 把 输出 
送 到 其 他 神经 元 。 神 经 键 是 神经 元 的 轴 突 和 其 他 神经 元 的 树 突 的 连接 点 。 树 突 从 相 邻 的 神经 
， 元 中 收集 电信 号， 把 它 传 给 胞 体 。 神 经 键 的 工作 就 是 给 传 到 相 邻 神经 元 的 信号 上 加 上 权重 : 
它 根据 产生 的 化 学 物质 的 数量 来 判断 是 强 连接 还 是 弱 连 接 。 

一 个 神经 元 有 两 种 状态 : 兴奋 和 抑制 。 如 果 接 收 的 信号 总 量 达 到 一 个 姜 值 ， 身 体 就 兴 
奋 ， 并 触发 一 个 输出 信号 ， 该 信号 传 给 轴 突 ， 最 终 传 给 其 他 的 神经 元 。 如 果 接 收 的 信号 总 量 
没有 达到 阔 值 ， 神 经 元 仍然 处 于 抑制 状态 : 它 不 触发 或 产生 输出 。 


18.6.2 感知 器 
感知 器 是 一 个 类 似 于 单个 生物 神经 元 的 人 工 神 经 元 。 它 带 有 一 组 具有 权重 的 输入 ， 对 输 


入 求 和 ， 把 结果 与 阔 值 进行 比较 。 如 果 结 果 大 
于 阐 值 ， 感 知 器 触发 ， 否则， 不 触发 。 当 感知 
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船 触发 时 ， 输 出 为 1; 不 触发 ， 输 出 为 0。 
加 输入 输出 (0 或 1) 
图 18-23 显示 了 一 个 带 有 5 个 输入 (xi~xs) 和 人 Ea 
5 个 权重 (wi 一 ws ) 的 感知 器 。 在 这 个 感知 器 X4* Wa 
中 ， 如 果 了 是 靖 值 ， 输 出 值 确 定 如 下 : Ks" Ws 
S= (Xi. WI+Xa . W2+X3. Wa+Xs. Wa+Xs. Ws) 图 18-23 ”感知 器 


if s>T， 那么 y=1; 否则 y=0 
假设 一 个 有 三 个 输入 和 一 个 输出 的 例子 ， 有 四 个 已 知 的 输入 /输出 ， 显 示 在 
下 表 中 : 


输 入 输 出 


1 
0 
1 
] 


一 


这 组 输入 被 用 来 训练 一 个 具有 等 权重 的 (wi = ws= w ) 感知 器 ， 阔 值 设 置 为 0.8， 所 有 
输入 的 原始 权重 为 50%。 如 果 产 生 的 输出 是 正确 的 (也 就 是 ， 与 实际 的 输出 匹配 )， 那 么 权 
” 重 保持 原来 的 值 。 如 果 产生 的 输出 小 于 输出 数据 ， 那 么 权重 将 上 升 10%; 如 果 产生 的 值 大 于 
输出 数据 ， 那 么 权重 将 下 降 10%。 下 表 显 示 了 应 用 先前 的 例子 训练 感知 器 的 过 程 。 


Tw | 

| | lm 

| | 

注意 ， 即 使 是 很 小 的 可 用 数据 集 ， 感 知 器 也 能 被 训练 。 在 实际 应 用 场合 ， 感 知 器 总 是 被 
一 个 大 得 多 的 训练 数据 集训 练 ( 100 或 1000 个 事例 )。 训 练 之 后 ， 感 知 器 准备 接收 新 的 输入 
数据 ， 产 生 一 个 可 接受 的 正确 的 输出 。 
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18.6.3 ”多 层 网 络 


几 个 层次 的 感知 器 可 以 组 合 起 来 ， 形 成 多 层 神 经 网 
络 。 每 一 层 的 输出 变 成 下 一 层 的 输入 。 第 一 层 称 为 输入 
层 ， 中间 层 称 为 隐藏 屋 ， 最 后 一 层 称 为 输出 是 。 输 入 层 
中 的 节点 不 是 神经 元 ， 它 们 是 分 配器 。 隐 藏 的 节点 通常 





用 来 给 上 一 层 的 输出 加 上 权重 的 。 图 18-24 显示 了 一 个 三 。 输入 层 隐藏 县 输出 层 
层 的 神经 网 络 。 图 18-24 多 层 神 经 网 络 
18.6.4 ”应 用 


当 有 足够 的 预先 定义 的 输入 和 输出 时 ， 就 可 以 使 用 神经 网 络 。 两 个 证 明神 经 网 络 有 用 的 
领域 是 光学 字符 识别 (OCR) (智能 体 读 任何 的 手写 体 ) 和 信用 赋值 (不 同 的 因素 赋予 不 同 的 
权重 去 建立 信用 等 级 ， 例 如 用 于 贷款 申请 )。 


18.7 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
Cawsey, A. The Essence of Artificial Inteiligence, Upper Saddle River, NJ: Prentice-Hall, 


1998 I 
Luger, G. Artificial Intelligence: Structures and Strategies for Complex Problem Solving, 
Reading, MA: Addison-Wesley, 2004 

Winston, P. Artificial Intelligence, Reading, MA: Addison-Wesley, 1993 

Coppin, B. Artificial Intelligence Tlluminated, Sudbury, MA: Jones and Bartlett, 2004 
Russel, S. and Norvig, P. Artificial Intelligence: A Modern Approach, Upper Saddle 
River, NJ: Prentice-Hall, 2003 

Dean, T. Artificial Intelligence: Theory and Practice, Redwood City Reading, MA: Addison- 


Wesley, 2002 
关键 术语 

artificial intelligence (人 工 智能 ) intelligent agent (智能 代理 ) 
axon ( 轴 突 ) LISP 
brute-force search ( 亦 力 搜索 ) modal logic ( 模 态 煞 辑 ) 
default logic (默认 逻辑 ) neural network (神经 网 络 ) 
dendrite ( 树 突 ) neuron (神经 元 ) 
edge detection (边缘 探测 ) parser (词法 分 析 上 器) 
expert System (专家 系统 ) perceptron (感知 器 ) 
frames (框架 ) physical agent (物理 智能 体 ) 
heuristic search (启发 式 搜 索 ) pragmatic analysis ( 语 用 分 析 ) 
high-order logic (高 阶 逻 辑 ) predicate logic (谓词 逻辑 ) 


image processing (图 像 处 理 ) PROLOG 
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propositional logic (命题 逻辑 ) soma( 胞 体 ) 
quantifier (量词 ) speech recognition (语音 识别 ) 
rule-based system (基于 规则 的 系统 ) synapse( 突 触 ) 
search space (搜索 空间 ) syntactic analysis (语法 分 析 ) 
segmentation (分 段 ) temporal logic( 时 态 人 逻辑) 
semantic analysis (语义 分 析 ) thresholding ( 阅 值 化 ) 
semantic network (语义 网 络 ) Turing test (图 灵 测 试 ) 
software agent (软件 智能 体 ) 

小 结 


。 人 工 智 能 是 编程 系统 的 研究 ， 它 能 在 一 定 程 度 上 模仿 人 类 的 活动 ， 如 感知 、 思 考 、 学 
习 和 动作 。 定 义 人 工 智能 的 一 种 方法 是 图 灵 测 试 ， 它 比较 人 类 和 机 器 的 智能 行为 。 

。 智 能 体 是 一 个 能 感知 环境 、 从 环境 中 学 习 并 智能 地 与 环境 交互 的 系统 。 智 能 体 可 以 分 
成 两 大 类 : 软件 智能 体 和 物理 智能 体 。 

。 虽然 通用 的 语言 (如 C、C++ 和 Java) 能 用 来 创建 智能 软件 ， 但 有 两 种 专门 为 人 工 智 ， 
能 设计 的 语言 ， LISP 和 PROLOG。 

。 知识 表示 是 人 工 智 能 的 第 一 步 。 我 们 讨论 了 4 种 常见 的 知识 表示 方法 : 语义 网 、 框 
架 、 谓 词 逻辑 和 基于 规则 的 系统 。 语 义 网 使 用 有 向 图 表示 知识 。 框 架 与 语义 网 紧密 相 
关 ， 其 中 数据 结构 (记录) 用 来 表示 相同 的 知识 。 谓 词 逻 辑 可 以 表示 一 个 良好 定义 的 
语言 ， 该 语言 在 理论 逻辑 的 悠久 历史 中 得 到 发 展 。 基 于 规则 的 系统 使 用 一 组 可 以 从 已 
知事 实 推导 出 新 事实 的 规则 来 表示 知识 。 

。 人工 智能 的 一 个 目标 是 建立 专家 系统 ， 完 成 通常 需要 人 类 专家 经 验 的 任务 。 它 们 可 以 
用 在 人 类 专家 缺少 、 昂 贵 或 不 可 用 等 场合 。 

。 人工 智能 的 另 一 个 目标 是 创造 行为 像 普 通 人 类 的 机 器 。 这 个 目标 的 第 一 部 分 涉及 图 像 
处 理 或 计算 机 视觉 ,这 是 处 理 对 象 感知 的 一 个 人 工 智 能 领域 。 目 标的 第 二 部 分 是 自然 
语言 的 语言 处 理 、 分 析 和 翻译 。 

。 在 人 工 智 能 中 ， 问 题 求解 的 一 种 技术 是 搜索 。 搜 索 可 以 描述 成 使 用 一 组 状态 (情形 ) 
求解 一 个 问题 。 有 两 大 类 搜索 ， 分 别 是 蛮 力 搜索 和 启发 式 搜 索 。 

。 如 果 智 能 体 应 该 表现 得 像 人 类 一 样 ， 那 么 它 可 能 就 需要 学 习 。 已 经 使 用 的 方法 中 有 几 
种 为 未 来 建立 了 希望 。 大 多 数 方法 使 用 归纳 学 习 和 从 例子 中 学 习 。 一 个 通常 的 方法 是 
使 用 神经 网 络 ， 使 用 神经 元 网 络 试图 模仿 人 脑 的 学 习 过 程 。 


18.8 练习 


小 测验 
在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q18-1 描述 图 灵 测 试 。 你 认为 该 测试 能 用 来 准确 地 定义 一 个 智能 系统 吗 ? 
Q18-2 定义 一 个 智能 系统 ， 列 出 两 大 类 智能 体 。 
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Q18-3 
Q18-4 
Q18-5 
Q18-6 
Q18-7 
Q18-8 
Q18-9 
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比较 人 工 智能 中 使 用 的 语言 LISP 和 PROLOG。 

描述 知识 表示 的 需要 ， 列 出 本 章 所 讨论 的 4 种 不 同 的 表示 方法 。 
比较 谓词 逻辑 和 命题 逻辑 。 

比较 框架 和 语义 网 。 

定义 一 个 基于 规则 的 系统 ， 并 与 语义 网 进行 比较 。 

比较 专家 系统 和 平凡 系统 。 

列 出 图 像 处 理 的 步骤。 


Q18-10 列 出 语言 处 理 的 步骤 。 
Q18-11 定义 神经 网 络 ， 它 是 如 何 模仿 人 类 的 学 习 过 程 的 ? 


Q18-12 ”定义 感知 器 。 
练习 题 


P18-1 


P18-2 
P18-3 


P18-4 


P18-5 


P18-6 


P18-7 


画 一 个 语义 网 ， 显 示 下 列 人 物 间 的 关系 : 主治 医生 、 家 庭 从 业者 、 遗 传 生态 学 、 实 习 医 生 、 


工程 师 、 会 计 师 、 法 国家 庭 从 业者 Pascal 博士 。 

把 练习 题 1 中 的 语义 网 表示 成 一 组 框架 。 

使 用 符号 R 表示 句子 “Itis raining”， 符 号 S 表示 句子 “lt is sunny”， 用 命题 逻辑 写 下 列 的 英 
语句 子 。 

a. It is not raining. 

c, lt is neither raining nor sunny. 
e.Ifit is sunny, then it is not raining. f. Ifit is raining, then it is not sunny. 

g. ltis sunny if and only ifit is not raining. h. Itis not true that if it is not raining, it is sunny. 


使 用 符号 C、W 和 五 分 别 代 表 “itis cold”“itis warm” 和 “itis hot”， 写 出 下 列 命 题 逻辑 中 


b. It is not sunny. 
d. lt is raining and sunny. 


的 句子 对 应 的 英语 句子 : 
a.—H b.WVH c.WAH d. WA (—H) 
e. 一 (WAH) fwWw—H g. ("CIW h.— (W— H) 


HS W ES NBDV BV ED) 

使 用 符号 Wh、Re、Gr 和 Fl 分 别 代表 谓词 “is white”“isred” “is green” 和 “is a flower”， 
用 谓词 逻辑 写 下 列 的 句子 : 

a. Some flowers are white. 

c. Not all flowers are red. 

e. There is not a green flower. 
g. Some flowers are not white. 
使 用 符号 Has、Loves、Dog 和 Cat 分 别 代 表 谓 词 “has”“loves”“isa dog” 和 “isa cat”"， 用 
谓词 逻辑 写 下 列 句子 : 
a. John has a cat, 

c. John loves Anne. 


b. Some flowers are not red. 
d. Some flowers are either red or white. 


f No flowers are green， 


b. John loves all cats. 

d. Anne loves some dogs. 

e. Not everything John loves is a cat. f. Anne does not like some cats. 

g. lf John loves a cat, Anne loves it. h. John loves a cat if and only if Anne loves it, 
使 用 符号 Expensive、Cheap、Buys 和 Sells 分 别 代 表 谓 词 “is expensive” “is che-ap”" buys” 
和 “sells"， 用 谓词 逻辑 写 下 列 句子 ; 
a. Everything is expensive. 

c. Bob buys everything that is cheap. 
e. Not everything is expensive. 

g. If something is cheap, then lt ls not expensive. 


b. Everything is cheap. 
d. John sells everything expensive. 
f. Not everything is cheap. 
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P18-8 用 符号 Identical 代表 谓词 “is identical to "”， 用 谓词 逻辑 写 下 列 句子 ， 注 意 谓词 “ equal ”需要 
两 个 参数 。 
a. John is not Anne. b. John exists. 
c. Anne does not exist. d. Something exists. 
e, Nothing exists. f There are at least two things. 
P18-9 用 真 值 表 检查 下 面 的 论断 是 否 合法 。 
{PQ, P}|-Q 
P18-10 ”用 真 值 表 检查 下 面 的 论断 是 否 合法 。 
{PVQ, P} |-Q 
P18-11 用 真 值 表 检 查 下 面 的 论断 是 否 合法 。 
{PAQ, P}|-Q 
P18-12 用 真 值 表 检 查 下 面 的 论断 是 否 合法 。 
让 一 Q，Q 一 R)|-(P 一 有 R) 
P18-13 画 出 一 个 能 模拟 OR 门 的 神经 网 络 。 


P18-14 ” 画 出 一 个 能 模拟 AND 门 的 神经 网 络 。 目标 状态 











P18-15 图 18-25 显示 了 8 数字 游戏 的 初始 和 目标 状态 ， 画 出 解 央 。 国 国 国 ays 

这 一 难题 的 启发 式 搜索 树 。 EE 和 
P18-16 显示 出 图 18-26 中 的 树 形 图 的 广度 优先 搜索 。 | 主刀 国 
P18-17 显示 出 图 18-16 中 的 树 形 图 的 深度 优先 搜索 。 图 18-25 练习 题 P18-15 
P18-18 画 出 图 18-27 中 迷宫 的 树 形 图 。 

aa 
-> p 
D E 





图 18-26 练习 题 P18-16 图 18-27 练习 题 P18-18 


P18-19 画 出 练习 题 P18-18 中 的 树 并 显示 出 广度 优先 搜索 。 
P18-20 画 出 练习 题 P18-18 中 的 树 并 显示 出 深度 优先 搜索 。 
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Foundations of Computer Science, Fourth Edition 


社交 媒体 导论 





在 本 章 中 ， 我 们 将 简要 地 提 及 社交 媒体 ， 它 是 计算 机 科学 的 应 用 之 一 。 本 章 的 目标 不 
在 于 展示 如 何 使 用 社交 媒体 ， 因 为 许多 学 生 已 经 知道 并 在 日 常生 活 中 使 用 了 社交 媒体 。 本 章 
主要 是 展示 社交 媒体 背后 的 概念 ， 以 及 网 站 是 如 何 设 计 以 体现 这 些 概念 的 。 本 章 将 仅仅 介绍 
Facebook 和 Twitter， 它 们 分 别 是 特定 社交 媒体 类 型 的 案例 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 人 够 : 

。 定义 Facebook 中 的 友谊 (friendship) 关系 ; 

。 定义 Facebook 上 朋友 之 间 的 相互 关系 ; 

。 理解 Facebook 的 交流 通道 ; 

。 了解 在 Facebook 上 如 何 成 为 一 个 成 员 ， 以 及 如 何 终止 成 员 权 利 ; 

。 了 解 如 何 登 录 和 登 出 Facebook; 

。 了解 如 何在 Facebook 上 找到 朋友 ; 

。 了解 如 何在 Facebook 上 与 朋友 交谈 ; 

。 定义 Twitter 中 的 跟随 (following) 关系 ; 

。 定义 Twitter 上 成 员 和 跟随 者 之 间 的 单 向 关系 ; 

。 理解 Twitter 的 交流 通道 ; 
了 解 如 何在 Twitter 上 成 为 一 个 成 员 ， 以 及 如 何 终止 成 员 权 利 ; 
了 解 如 何 登 录 和 登 出 Twitter; 
了 解 如 何在 Twitter 上 跟随 其 他 成 员 ; 
了 解 如 何在 Twitter 上 和 跟随 者 进行 交流 。 


19.1 引言 

在 过 去 的 一 个 世纪 里 ， 计 算 机 科学 开始 成 为 一 门 学 科 ， 我 们 永远 无 法 想象 这 门 学 科 在 如 
此 短 的 时 间 内 成 为 我 们 日 常生 活 的 一 部 分 。 计 算 机 科学 惠及 大 众 的 领域 之 一 便 是 社交 媒体 。 
如 今世 界 上 大 部 分 的 人 都 或 多 或 少 使 用 一 种 或 多 种 社交 媒体 ， 这 可 以 看 作 一 个 计算 机 科学 应 
用 。 事 实 上 ， 社交 媒体 是 几 种 计算 机 科学 学 科 应 用 的 产物 ， 这 些 学 科 包 括 操作 系统 、 计 算 机 
编程 、 计 算 机 网 络 以 及 数据 库 。 

社交 媒体 平台 是 大 规模 的 网 站 ， 它 被 设计 用 来 让 人 们 交换 彼此 的 想法 、 观 点 和 经 验 。 一 
些 社交 媒体 平台 主要 被 设计 用 来 交换 信息 或 图 片 ; 而 另 一 些 被 用 来 让 求职 者 找到 雇主 ， 让 雇 
主 找到 雇员 。 

对 于 所 有 类 型 的 社交 媒体 的 讨论 将 会 众说 纷 绒 。 因 此 ， 在 本 章 中 我 们 仅 讨论 两 种 类 型 ， 
Facebook 和 Twitter。 我 们 选取 这 两 种 类 型 ， 是 因为 Facebook 和 Twitter 背后 的 概念 十 分 复 
杂 ， 这 些 概 念 或 多 或 少 在 其 他 网 站 上 有 所 体现 。 
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19.2 Facebook 
Facebook 是 一 种 允许 全 球 的 家 人 和 朋友 互相 保持 联系 的 社交 媒体 ， 用 户 可 以 彼此 之 间 
交流 思想 、 图 片 、 评 论 等 。 


“Facebook 允许 成 员 分 享 思想 、 图 片 并 评论 。 人 人 


19.2.1 梗概 


在 解释 如 何 使 用 Facebook 之 前 ， 首 先 来 考虑 其 背后 的 梗概 。 

1. 友 这 (friendship) 

在 Facebook 上 ， 只 有 朋友 之 间 可 以 进行 分 享 。 友 谊 是 一 个 一 对 一 的 相互 关系 。 如 果 
John 是 Lucie 的 朋友 ， 那么 Lucie 也 是 John 的 朋友 。 然 而 ， 这 种 关系 并 不 是 可 传递 的 ， 如 
果 John 是 Lucie 的 朋友 ， 而 Lucie 又 是 Ann 的 朋友 ， 这 并 不 能 说 明 John 是 Ann 的 朋友 。 如 
果 想 要 说 明 这 一 点 ，John 或 Ann 需要 互相 请 求 成 为 朋友 。 


在 Facebook 上 ， 朋友 的 朋友 不 一 定 是 朋友 。 | NE ; 由 Me 
尽管 在 Facebook 上 有 数 以 亿 计 的 成 员 ， 但 为 方便 讨论 ， 在 本 书 中 假设 只 有 8 个 成 员 
(M1 到 M8 )， 如 图 19-1 所 示 。 


图 19-1 仅 有 8 个 成 员 的 Facebook 


Ou 


Facebook 


现在 假设 有 以 下 对 友谊 的 请 求 ， 并 且 这 些 请 求 都 被 其 他 成 员 接 受 了 。 
1 ) M1 请 求 与 M2 成 为 好 友 。 

2 ) M2 请 求 与 M5 成 为 好 友 。 

3 ) M3 请 求 与 M2 成 为 好 友 。 

4 ) M4 请 求 与 M7 成 为 好 友 。 

5 ) M6 请 求 与 M3 成 为 好 友 。 

6 ) M7 请 求 与 M6 成 为 好 友 。 

7 ) M8 请 求 与 M2 成 为 好 友 。 

图 19-2 展示 了 在 交友 请 求 被 接受 后 8 个 成 员 的 关系 。 


© 


< 一 > 友谊 


Faccbook 





图 19-2 在 交友 请 求 被 接受 后 8 个 成 员 的 关系 
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注意 ，Facebook 掌管 着 每 一 个 成 员 的 信息 ， 在 好 友 请 求 被 发 出 和 同意 之 后 在 两 者 之 间 


建立 链接 。 


2. 交流 
尽管 成 员 之 间 的 友谊 是 双向 的 关系 ,但 我 们 可 以 假定 一 个 成 员 单 方面 是 许多 人 的 朋友 : 


一 个 成 员 发 布 了 某 个 帖子 ， 则 他 的 所 有 朋友 都 可 以 看 到 ， 如 图 19-3 所 示 。 

a. M1 发 布 的 ，M2 可 以 看 到 ; 

b. M2 发 布 的 ，M1、M3、M5 和 M8 可 以 看 到 ; 

c. M3 发 布 的 ，M2 和 M6 可 以 看 到 ; 

d. M4 发 布 的 ，M7 可 以 看 到 ; 

e. M5 发 布 的 ，M2 可 以 看 到 ; 

f M6 发 布 的 ，M3 和 M7 可 以 看 到 ; 

g. M7 发 布 的 ，M4 和 M6 可 以 看 到 ; 

h. M8 发 布 的 ，M2 可 以 看 到 。 


3 发 送 者 () 接收 者 > 交流 








图 19-3 ” Facebook 上 一 对 多 的 交流 


19.2.2 网 页 

Facebook 使 用 了 一 些 网 页 ， 但 是 最 常用 的 两 个 网 页 是 主页 和 用 户 页 。 在 解释 如 何 使 用 
它们 之 前 ， 首 先 对 这 两 个 网 页 进行 展示 。 

1. 主页 

主页 只 用 来 注册 和 登录 Facebook。 在 图 19-4 中 展示 了 主页 的 样式 。 

2. 用 户 页 

用 户 页 是 你 将 在 Facebook 上 使 用 的 主要 页 面 。 这 个 页 面 十 分 复杂 ， 图 19-5 中 展示 了 用 
户 页 的 样式 。 注 意 ， 在 你 的 页 面 的 第 一 行 总 是 有 一 个 工具 栏 ， 上 面 有 三 列 ， 但 是 左边 的 两 列 
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可 以 滚动 以 显示 更 多 选项 。 


19.2.3 成 员 


要 想 使 用 Facebook, 你 需要 成 为 Facebook 的 成 员 。 为 此 ， 你 需要 进行 注册 。 如 果 想 要 


停止 成 员 状 态 ， 你 需要 注销 ， 或 是 停 用 账户 。 


1. 注册 
为 了 成 为 Facebook 的 成 员 (这 是 免费 的 )， 你 需要 前 往 Facebook 的 主页 (www. 人 acebook. 


com)( 如 图 19-4 所 示 )， 使 用 接 下 来 的 步骤 进行 注册 


] ) 忽略 log-in 部 分 ， 点 击 sign-up 部 分 。 

2 ) 在 相应 的 框 中 填 人 你 的 姓 和 名 。 

3 ) 在 相应 的 框 中 填 入 你 的 邮箱 和 手机 号 。 

4 ) 在 接 下 来 的 框 中 重新 输入 你 的 邮箱 和 手机 号 。 
5 ) 选择 你 的 出 生日 期 (月 , 日 , 年 )。 

6 ) 检查 你 的 性 别 。 

7) 点 击 sign-up 按钮 。 


INaiTTN RS 


Sign U 


p 
lf’s free and always will be. 


| 田 See photos and updates 
Email or miobjle number 


Conneet with friends and (he 
world around you on Faccbook， 


Re-enter email or mobile number 
3 Shares What neyw 


Birthdsy 
an [er 加 | 


OO Female OO Male 


图 19-4 Facebook 主页 





2. 注销 ( 停 用 ) 
如 果 想 永久 停 用 你 在 Facebook 上 的 账户 ， 你 需要 前 往 用 户 页 (图 19-5 ) 并 进行 以 下 操作 : 


1 ) 在 工具 栏 的 最 右边 点 击 向 下 的 箭头 。 
2 ) 在 子 菜单 出 现 的 时 候 ， 点 击 Settings。 


3 ) 点 击 Security。 
4 ) 选择 Deactivate your account， 并 且 按 照 接 下 来 的 指令 进行 操作 确认 。 


全 Find friends Q 是 name home find freinds 





图 19-5 Facebook 用 户 页 
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19.2.4 获取 Facebook 的 服务 
即使 已 经 注册 成 为 Facebook 的 成 员 ， 如 果 想 要 使 用 Facebook， 你 也 需要 登录 。 如 果 在 
一 段 时 间 内 不 想 人 使用， 那么 你 可 以 登 出 。 


1. 登录 
想 要 登录 你 的 账户 ， 你 需要 前 往 Facebook 的 主页 (www.facebook.com) (图 19-4 )。 在 


第 一 行 ， 输 入 你 的 邮箱 或 手机 号 ， 输 入 密码 ， 接 着 点 击 log-in 按钮 。 如 果 出 现 了 你 的 页 面 ， 
那 就 意味 着 现在 你 可 以 使 用 Facebook 了 。 


2. 登 出 
如 果 你 有 一 段 时 间 不 想 使 用 Facebook， 那 么 可 以 登 出 。 在 用 户 页 (你 的 页 面 ) 的 工具 栏 


(图 19-5 ) 点 击 向 下 的 箭头 ， 弹 出 菜单 ， 接 着 点 击 log-out 按钮 。 


19.2.5 ”朋友 


如 前 所 述 ， 使 用 Facebook 的 总 体 思 想 是 和 朋友 保持 联系 。 如 果 你 在 Facebook 网 站 上 发 
布 了 帖子 ,那么 需要 有 朋友 来 看 到 这 些 东 西 。 如 果 你 想 要 看 到 其 他 成 员 的 帖子 ， 就 必须 成 为 
她 的 朋友 。 换 句 话 说， 在 开始 通过 Facebook 进行 交流 之 前 ， 你 需要 找到 朋友 ， 并 且 能 够 让 


其 他 成 员 将 你 作为 朋友 。 

1. 寻找 朋友 

在 Facebook 上 有 许多 方法 来 找到 朋友 。 

同意 Facebook 推荐 

你 可 以 同意 Facebook 好 友 推 荐 ， 这 是 基于 你 在 注册 时 提供 的 信息 进行 的 推荐 。 如 果 想 
同意 推荐 ， 前 往 你 的 页 面 工具 栏 ( 见 图 19-5 )， 并 且 点 击 find friends 按钮 ， 接 着 会 显示 一 个 
列表 ， 列 表 中 显示 你 可 能 认识 的 人 。 这 个 列表 被 划分 为 几 个 类 别 (例如 ， 你 可 能 认识 的 人 ， 
共同 好 友 ， 来 自 你 家 乡 的 人 ， 来自 当前 城市 的 人 ,来 自 高 中 、 大 学 的 人 ， 雇 主 ， 等 等 )， 你 
可 以 滚动 来 进行 选择 。 在 每 一 类 中 ， 你 可 以 选择 那些 想 要 与 之 成 为 朋友 的 人 ， 并 点 击 姓名 前 
面 的 add friend 按钮 。 

关注 电子 邮件 联系 人 

你 可 以 关注 那些 定期 使 用 电子 邮件 联系 你 的 人 。 在 你 的 页 面 工具 栏 (图 19-5) 上 点 击 
friend 图 标 (在 find friends 按钮 旁边 的 那个 ) 。Facebook 展示 了 有 不 同 电子 邮件 图 标的 网 页 。 
选择 合适 的 网 页 ， 接 着 输入 你 的 邮件 和 密码 以 查看 和 你 进行 电子 邮件 通信 的 个 人 的 列表 。 如 
果 你 想 要 这 个 列表 上 的 一 些 人 成 为 你 在 Facebook 上 的 朋友 ， 点 击 add friend 按钮 。 

查找 你 知道 的 人 

在 你 的 页 面 工具 栏 的 左边 (图 19-5 )， 输 入 成 员 的 名 字 ， 接 着 点 击 搜索 按钮 ，Facebook 
会 展示 有 着 那个 名 字 的 成 员 列 表 。 如 果 你 找到 了 你 所 认识 的 一 些 人 ， 和 那么 点 击 这 个 名 字 来 查 
看 他 们 的 简介 。 如 果 你 想 让 那个 人 成 为 你 在 Facebook 上 的 朋友 ， 点 击 add friend 按钮 。 

2. 同意 来 自 其 他 成 员 的 好 友 请 求 

其 他 成 员 可 能 想 要 将 你 作为 他 们 的 朋友 。 在 这 种 情况 下 ， 在 收 到 他 们 的 请 求 的 时 候 ， 你 
可 以 同意 或 拒绝 这 些 请 求 。 在 工具 栏 上 ， 点 击 friend request 按钮 ， 你 将 会 看 到 所 有 给 你 好 
友 六 请 的 成 员 的 资料 。 你 可 以 点 击 成 员 名 字 前 面 的 confirm 或 是 decline 按钮 来 同意 或 者 拒 
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3. 解除 好 友 关 系 
你 可 以 在 任何 时 候 将 你 的 朋友 列表 中 的 任何 成 员 移 除 。 要 想 这 么 做 ， 点 击 你 的 页 面 工具 
栏 上 你 的 资料 图 (图 19-5 )， 点 击 你 的 名 字 下 方 的 friends 按钮 来 查看 好 友 列 表 。 滚 动 滚轮 直 


到 看 到 你 想 要 移 除 的 那个 成 员 ， 接 着 点 击 unfriend 按钮 。 


19.2.6 ”交换 信息 


Facebook 的 总 体 目的 在 于 允许 朋友 之 间 交 换 新 闻 (文本 、 照 片 、 视 频 等 )。 为 了 接收 你 
的 朋友 的 帖子 ， 前 往 news feed， 帖 子 将 会 出 现在 这 个 部 分 。 如 果 想 要 给 你 的 朋友 发 送 新 闻 ， 
你 需要 点 击 update your status。 接 下 来 对 这 两 部 分 进行 简要 介绍 。 

1. 读 新 闻 

想 了 解 你 的 朋友 发 表 过 的 帖子 ， 回 到 工具 栏 (图 19-5 ) 并 点 击 home 按钮 。 你 将 会 看 到 
你 的 朋友 发 布 过 的 所 有 最 新 帖子 。 每 一 个 帖子 都 包括 你 朋友 的 名 字 、 发 帖 的 时 间 以 及 内 容 ， 
可 能 还 包括 网 页 的 链接 。 已 经 发 表 过 的 照片 也 会 在 这 里 出 现 ， 你 可 能 希望 通过 点 击 这 些 图 片 
来 放大 它们 。 如 果 在 帖子 中 有 一 些 视 频 ， 那 么 新 闻 的 主题 会 出 现 一 个 短文 ， 同 时 会 出 现 播放 
箭头 ， 点 击 箭头 就 可 以 查看 视频 了 。 

对 已 发 布 帖子 进行 评论 

在 已 发 布 信息 的 所 有 项 目 〈 被 称 作 更 新 ) 中 ， 有 一 个 like 按钮 ， 你 可 以 点 击 这 个 按钮 来 
表明 你 很 喜欢 这 个 帖子 。 


分 享 发 布 的 帖子 
点 击 原 帖子 的 share 按钮 ， 会 出 现 一 个 新 窗口 。 在 新 窗口 输入 你 对 于 这 个 帖子 的 评论 ， 


接着 点 击 新 窗口 上 的 share 按钮 。 通 过 这 种 方式 ， 你 就 可 以 向 你 的 朋友 发 布 任何 你 收 到 的 
帖子 。 

2. 发 布 新 闻 

Facebook 可 以 让 你 向 朋友 们 发 布 新 闻 ( 称 作 “更 新 ”)。 这 个 新 闻 可 以 是 一 篇 长 消息 
(60 000 字符 以 内 )、 网 页 的 链接 、 照 片 或 者 视频 。 


发 布 新 闻 
想 要 发 布 新 闻 ， 前 往 工 具 栏 (图 19-5 ) 并 且 点 击 home 按钮 来 查看 发 布 窗口 。update 


status (更 新 状态 ) 将 会 被 默认 选择 。 点 击 what's on your mind 按钮 ， 输 入 你 的 新 闻 。 接 着 点 
击 post 按钮 来 向 你 的 朋友 展示 这 些 新 闻 。 

发 布 照 片 或 视频 

在 发 布 窗口 ， 点 击 add photos/video 按钮 ， 接 着 选择 右边 的 按钮 来 发 布 你 的 照片 或 
视频 。 

标记 

如 果 你 想 要 在 你 的 帖子 中 提 到 一 个 朋友 ， 你 可 以 标记 那个 朋友 。 想 要 这 样 做 ， 你 需要 点 
击 tag 按钮 (头像 )， 接 着 从 列表 中 选择 朋友 的 名 字 。 

限制 可 以 看 到 帖子 的 人 

通常 情况 下 ， 你 在 Facebook 上 发 布 帖子 ， 所 有 的 Facebook 成 员 都 可 以 看 到 。 你 可 以 限 
定 仅 对 朋友 可 见 或 者 仅 对 自己 可 见 。 在 status update 窗口 -点击 public 按钮 以 让 任何 人 看 到 
帖子 ， 点 击 friends 按钮 以 便 只 有 你 的 朋友 可 以 看 到 帖子 ,或 者 点 击 only me 按钮 ， 这 样 的 
话 只 有 你 自己 可 以 看 到 帖子 。 
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19.3 Twitter 
Twitter 是 一 个 社交 网 络 ， 它 允许 成 员 发 布 短 消息 (被 称 作 推广 (tweet))， 最 多 可 以 输入 


140 个 字符 。 推 文 可 以 让 成 员 的 跟随 者 看 见 。 


Twitter 允许 成 员 向 其 跟随 者 发 布 推 文 。 


19.3.1 梗概 

在 展示 如 何 使 用 Twitter 之 前 ， 首 先 讨论 这 个 社交 媒体 网 站 背后 的 梗概 。 

1. 成 员 - 跟随 者 关系 

在 Twitter， 成 员 与 其 跟随 者 之 间 存 在 一 对 多 关系 。 一 群 Twitter 的 成 员 跟 随 他 们 喜欢 的 
成 员 ， 被 跟随 者 甚至 不 知道 他 们 的 跟随 者 都 有 哪些 。 这 类 似 于 名 人 和 其 粉丝 之 间 的 关系 : 跟 
随 者 对 于 名 人 所 做 的 事情 感 兴 趣 ， 但 是 名 人 可 能 根本 不 知道 这 些 跟随 者 是 谁 。 

让 我 们 假定 在 Twitter 网 站 上 有 8 个 成 员 ， 如 图 19-6 所 示 。 现 在 假设 有 一 些 成 员 决 定 按 
照 下 列 规则 跟随 其 他 成 员 : 

1 ) M1 跟随 M2 和 M5。 

2 ) M2 跟随 M3。 

3 ) M3 跟随 M4 和 M5。 

4 ) M4 跟随 M3 和 M38。 

5 ) M5 跟随 M2 和 M6。 

6 ) M6 跟随 M8。 

7 ) M7 跟随 M3。 

8 ) M8 跟随 M7。 


图 19-6 仅 有 8 个 成 员 的 Twitter 


Or" 


Twitter 


图 19-7 展示 了 最 新 的 单 向 关系 。 


Twitter 





图 19-7 跟随 -被 跟随 关系 
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2. 交流 
在 Twitter 上 ， 可 以 很 容易 地 将 交流 看 作 一 对 多 关系 。 成 员 为 其 跟随 者 发 布 推 文 。 图 


19-8 展示 了 这 个 场景 。 





图 19-8 Twitter 上 一 对 多 的 交流 


a. M1 没有 跟随 者 。 这 意味 着 M1 发 布 的 推 文 无 人 可 见 。 

b. M2 的 跟随 者 有 M1 和 M5。 这 意味 着 M2 发 布 的 推 文 可 以 被 M1 和 M5 所 见 。 

c. M3 的 跟随 者 有 M2、M4 和 M7。 这 意味 着 M3 发 布 的 推 文 可 以 被 M2、M4 和 M7 所 见 。 
d. M4 的 跟随 者 有 M3。 这 意味 着 M4 发 布 的 推 文 仅 可 以 被 M3 所 见 。 

e. M5 的 跟随 者 有 M1 和 M3。 这 意味 着 M5 发 布 的 推 文 可 以 被 M1 和 M3 所 见 。 

f. M6 的 跟随 者 只 有 M5。 这 意味 着 M6 发 布 的 推 文 仅 可 以 被 Ms 所 见 。 

g. M7 没有 跟随 者 。 这 意味 着 M7 发 布 的 推 文 无 人 可 见 。 

h. M8 的 跟随 者 有 M4 和 M6。 这 意味 着 M8 发 布 的 推 文 可 以 被 M4 和 M6 所 见 。 


19.3.2 页 面 


Twitter 的 网 站 上 有 一 些 页 面 ,但 是 主要 使 用 的 两 个 页 面 是 Web 页 和 Home 页 。 其 他 页 
面 可 以 通过 这 两 个 页 面 之 一 进行 访问 。 在 阐述 如 何 使 用 这 两 个 页 面 之 前 ， 首 先 对 这 两 个 页 面 
进行 描述 。 三 per om © 

1. Web 页 PR 

Web 页 主要 用 于 第 一 次 加 入 Twitter， 或 者 你 想 要 登 
录 上 自己 的 账户 时 (图 19-9 )。 

2. Home 页 

当 你 已 经 有 了 Twitter 账户 ， 并 且 想 要 使 用 
Twitter 的 时 候 ， 就 需要 使 用 Home 页 。 这 个 页 面 
的 主要 格式 如 图 19-10 所 示 。 


19.3.3 成 员 


和 其 他 社交 媒体 一 样 ， 成 为 成 员 你 需要 进行 注 me 
册 (图 19-9 )。 如 果 你 想 要 关闭 账户 ， 那 么 需要 注 图 19-10 Twitter 的 Home 页 
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销 (图 19-10 )。 


1. 注册 
想 要 成 为 Twitter 的 成 员 ， 你 需要 前 往 www.twitter.com 来 找到 Twitter 的 网 页 ， 如 图 19-9 


所 示 。 接 下 来 ， 点 击 sign-up 按钮 ， 页 面 会 显示 如 图 19-11 所 示 的 注册 和 窗口。 
在 这 个 注册 窗口 中 ， 填 人 你 的 全 名 、 电 话 或 电子 邮件 ， Joln TINor tony. 
以 及 你 的 密码 。 接 着 点 击 sign-up 按钮 以 加 入 成 为 成 员 。 DT) DT TN 
2. 注销 ( 停 用 ) 
想 要 永久 地 注销 你 在 Twitter 上 的 账户 ， 前 往 Twitter 
的 Home 页 (图 19-10 ) 并 按照 如 下 步骤 进行 操作 : 
1 ) 点 击 profile 和 settings 图 标 。 
2 ) 当 弹 出 新 的 窗口 时 ， 点 击 settings 和 privacy 按钮 。 
3 ) 当 弹 出 新 的 窗口 时 ， 点 击 deactive my account 按钮 。 


19.3.4 获取 Twitter 的 服务 


即使 你 成 为 Twitter 的 成 员 ， 当 想 要 使 用 Twitter 的 时 候 ， 也 需要 登录 。 当 不 想 使 用 
Twitter 的 时 候 ， 你 可 以 登 出 。 

1. 登录 

如 果 你 成 为 Twitter 的 成 员 ， 可 以 从 任何 一 台电 脑 或 者 Popinto vour Aecount 
手机 进行 登录 。 在 Twitter 的 Web 页 (图 19-9) 上 ， 点 击 
log-in 按钮 来 查看 登录 窗口 (如 图 19-12 所 示 )。 

在 登录 窗口 中 ， 输 入 你 的 全 名 、 电 话 或 电子 邮件 ， 
以 及 你 的 密码 。 接 着 点 击 log-in 按钮 ， 现 在 就 可 以 使 用 图 19-12 Twitter 的 登录 窗口 
Twitter 了 。 

2. 登 出 

想 要 登 出 Twitter， 前 往 Twitter 的 Home 页 (图 19-10 )， 并 按照 如 下 步骤 进行 操作 : 

1 ) 点 击 profile 和 settings 图 标 。 

2 ) 当 新 窗口 打开 时 ， 点 击 log-out 按钮 。 


19.3.5 ”跟随 以 及 被 跟随 


Twitter 的 总 体 思想 是 允许 成 员 与 其 跟随 者 之 间 进 行 交 流 。 如 果 成 员 跟 随 了 其 他 的 成 员 ， 
那么 他 就 会 收 到 推 文 。 如 果 成 员 有 了 跟随 者 ， 那 么 他 们 可 以 发 送 有 用 的 推 文 给 那些 跟随 者 ， 
跟随 者 们 会 收 到 这 些 推 文 。 

1. 你 需要 跟随 其 他 成 员 

如 果 想 要 收 到 来 自 特定 成 员 的 推 文 ， 你 需要 让 Twitter 知道 你 想 要 跟随 他 们 。 不 需要 获 
得 你 想 要 跟随 的 人 的 许可 (除非 他 们 明确 地 要 求 Twitter 阻止 跟随 者 )。 如 果 你 输入 了 你 想 要 
跟随 的 成 员 的 名 字 ， 那 么 Twitter 就 会 在 你 的 档案 中 产生 一 份 他 们 的 名 单 ， 每 一 次 这 些 成 员 
之 一 发 布 推 文 的 时 候 ， 你 就 会 收 到 一 份 副本 。 问 题 在 于 : 如 何 告诉 Twitter 你 想 要 跟随 的 人 
是 谁 ? 有 以 下 几 种 方法 。 

接受 Twitter 推荐 

你 可 以 接受 Twitter 的 推荐 (基于 你 过 去 的 活动 和 兴趣 )。 想 要 接受 推荐 ， 前 往 Twitter 





图 19-11 Twitter 的 注册 窗口 
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的 Home 页 的 左下 部 分 ， 即 who to follow 窗口 ， 如 图 19-13 所 示 。 接 着 点 击 view-all 按钮 来 
查看 Twitter 的 推荐 。 想 要 了 解 更 多 这 些 成 员 的 消息 ， 点 击 @name。 想 要 跟随 一 个 成 员 ， 点 
击 follow 按钮 。 

跟随 电子 邮件 联系 人 

你 可 以 跟随 那些 经 常用 电子 邮件 联系 你 的 人 。 在 who to follow 页 面 (图 19-13) 上 ,点 
击 find friends 按钮 (最 下 方 )。 在 接 下 来 的 窗口 中 会 出 现 电 子 邮 件 提 供 者 的 列表 ， 你 可 以 从 
中 选择 那些 通过 电子 邮件 来 联系 你 的 朋友 。 


Who to Follow Refresh View all 


寻找 特定 的 人 或 组 织 口 Namel (Wnamel 
在 who to follow 竣 分 (图 19-13 点 击 view all 按钮 。 @ Follow 


口 Name2 @name2 


当 新 的 窗口 打开 时 ， 输 入 真实 的 名 字 或 者 你 正在 寻找 的 人 ® Follow 
或 组 织 的 Twitter 名 字 。 点 击 搜索 按钮 。 如 果 某 人 或 某 组 织 | 口 四 
在 Twitter 上 是 这 个 名 字 ， 那 么 你 就 可 以 选择 跟随 他 们 。 Find friends 

停止 跟随 成 员 

你 可 能 会 鉴于 某 些 原因 希望 停止 接收 来 自 成 员 的 推 。 “13 who to follow 页面 
文 。 想 要 这 样 做 ， 你 必须 取消 关注 他 们 。 前 往 Twitter 的 主页 ， 点 击 following 链接 。 将 鼠标 
移动 到 该 成 员 的 follow 按钮 上 ， 将 这 个 按钮 变 成 unfollow。 

2. 其 他 跟随 你 的 成 员 

如 果 你 想 让 你 自己 的 推 文 被 其 他 人 阅读 ， 你 需要 有 跟随 者 。 然 而 ， 你 不 能 够 选择 你 的 跟 
随 者 ， 他 们 必须 找到 你 并 且 决 定 跟随 你 。 他 们 跟随 你 不 需要 你 的 同意 ， 但 是 如 果 你 想 要 决定 
是 否 让 他 们 跟随 ， 你 可 以 告诉 Twitter 你 想 要 阻止 特定 的 跟随 者 。 


19.3.6 发送 推 文 


尽管 你 个 人 不 需要 知道 你 的 所 有 跟随 者 一 一 是 他 们 选择 你 ， 而 不 是 你 选择 他 们 一 一 并 且 
也 不 能 够 直接 和 他 们 进行 交流 ， 但 Twitter 有 一 份 你 的 跟随 者 的 名 单 。 想 要 给 你 的 跟随 者 发 
送 推 文 ， 只 需要 将 推 文 发 布 到 你 的 Twitter 页 面 ， 网 站 将 会 把 它 发 送 到 你 的 所 有 跟随 者 处 。 





1. 创作 一 篇 新 推 文 


首先 你 需要 了 解 的 是 如 何 创 作 一 篇 新 推 人 


文 。 这 可 以 通过 以 下 步骤 完成 ( 见 图 19-14 )。 gg 
1 ) 在 任意 Twitter 网 页 上 点 击 tweet 
按钮 ， 查 看 compose new tweet 面板 。 
2) 在 compose new tweet 面板 上 ， 
输入 你 的 信息 。 
3 ) 点 击 tweet 按钮 来 发 布 你 的 推 文 ， 0 
这 个 按钮 位 于 页 面 的 底部 。 图 19-14 ”创作 一 篇 新 推 文 
4 ) Twitter 收 到 你 的 推 文 ， 在 推 文 顶 
映 增 加 你 的 档案 (包括 你 的 姓名 )。 
5 ) Twitter 接 下 来 就 会 将 副本 发 送 给 你 的 所 有 跟随 者 。 
2. ?| 用 其 他 人 的 推 文 
在 你 发 送 的 任何 推 文中 ， 还 可 以 引用 其 他 用 户 的 推 文 。 这 可 以 通过 两 种 方式 来 完成 使 
用 “@” 符 号 或 使 用 标签 。 
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使 用 “@ ”符号 
当 你 要 给 你 的 跟随 者 发 送 推 文 时 ， 如 果 你 想 要 引用 其 他 用 户 的 推 文 ， 那么 可 以 插入 那个 
用 户 的 名 字 ， 并 在 名 字 前 面 增加 @ 符号 。 任 何 你 的 跟随 者 可 以 点 击 那个 名 字 来 查看 该 用 户 
发 布 的 推 文 。 
使 用 标签 
有 时 你 想 要 引用 来 自 不 同 发 送 者 的 包含 特定 单词 或 者 短语 的 推 文 的 集合 。 这 个 时 候 你 
可 以 在 单词 的 前 面 使 用 标签 (#)， 这 样 这 个 单词 就 成 为 关键 词 ， 它 代表 一 个 特定 的 主题 或 问 
题 ， 任 何 对 这 个 单词 的 点 击 会 显示 包含 这 个 单词 的 所 有 最 近 推 文 。 


19.3.7 ”接收 推 文 


在 你 确定 并 指明 那些 你 想 要 跟随 的 成 员 之 后 ， 他 们 发 布 的 任何 推 文 都 会 显示 在 你 的 
Twitter 主页 (也 叫 作 Twitter feed)。 想 要 前 往 你 的 主页 ， 点 击 Twitter 工具 栏 左 上 方 的 home 
图 标 ( 见 图 19-10 )， 这 个 图 标 会 将 what's happening 部 分 放大 。 在 读 完 任何 推 文 之 后 ， 你 
可 以 : 

1 ) 点 击 箭头 来 创作 一 篇 推 文 ， 以 回应 推 文 的 发 送 者 。 

2 ) 点 击 双 箭头 来 为 他 们 的 跟随 者 转发 已 收 到 的 推 文 。 

3 ) 点 击 星 号 表明 自己 育 欢 这 个 推 文 。 


19.4 章 末 材料 
推荐 阅读 


有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
Russel Matthew A. Mining the Social Web, Sebastopol, CA: O’Reilly, 2014 


关键 术语 
Facebook news (新 闻 ) 
follow (跟随 ) sign out (注销 ) 
following (跟随 者 ) social media (社交 媒体 ) 
friend( 朋 友 ) tweet ( 推 文 ) 
friendship〈 友 谊 ) Twitter 
hashtag (标签 ) user page 《用户 页 ) 
home page (Home 页 ) Web page (Web 页 ) 
总 结 z 


。 Facebook 允许 家 人 和 全 球 各 地 的 朋友 相互 联系 。 1 

。 在 Facebook 上 ， 每 一 个 成 员 都 需要 找到 能 够 交流 的 朋友 ， 但 是 朋友 的 朋友 不 一 定 是 
朋友 。 

。Facebook 上 的 交流 是 一 对 多 的 ， 一 个 成 员 发 布 的 内 容 可 以 被 其 所 有 的 朋友 看 到 。 

。 为 了 成 为 Facebook 的 成 员 ， 你 需要 注册 。 想 要 结束 成 员 关 系 ， 你 需要 注销 。 

。 想 要 使 用 Facebook， 你 需要 登录 ; 想 要 停止 使 用 Facebook 一 段 时 间 ， 你 需要 登 出 。 

。 Twitter 允许 成 员 为 他 们 的 跟随 者 发 布 推 文 以 供 阅读 。 





Wai 


开奖 碟 供 学 论 





。 在 Twitter 上 ， 每 一 个 成 员 都 需要 找到 能 够 跟随 的 其 他 成 员 。 

。 Twitter 上 的 交流 是 一 对 多 的 。 一 个 成 员 发 布 的 所 有 推 文 都 可 以 被 他 所 有 的 跟随 者 看 到 。 
。 想 要 成 为 Twitter 上 的 成 员 ， 你 需要 注册 。 想 要 结束 成 员 关 系 ， 你 需要 注销 。 

。 为 了 使 用 Twitter， 你 需要 登录 ; 想 要 停止 使 用 Twitter 一 段 时 间 ， 你 需要 登 出 。 

。 要 想 收 到 来 自 其 他 成 员 的 推 文 ， 你 需要 跟随 其 他 的 成 员 。 


19.5 练习 
小 测验 

在 本 书 网 站 上 提供 了 一 套 与 本 章 相 关 的 交互 式 试题 。 强 烈 建议 学 生 在 做 本 章 练 习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


判断 题 


判断 以 下 语句 是 否 正确 。 

T19-1 在 Facebook 上 ， 成 员 为 他 们 的 跟随 者 发 布 内 容 。 

T19-2 在 Facebook 上 ， 朋 友之 间 可 以 进行 分 享 。 

T19-3 在 Facebook 上 ， 朋 友 的 朋友 也 是 朋友 。 

T19-4 Facebook 上 的 友谊 关系 是 一 种 单 向 关系 。 

T19-5 ”Facebook 上 的 交流 是 单 向 的 。 

T19-6 想 要 在 Facebook 上 登记 ， 你 需要 在 用 户 页 上 进行 。 

T19-7 在 Facebook 上 只 有 一 种 找到 朋友 的 方式 。 

T19-8 ” Facebook 上， 一 个 成 员 发 布 的 消息 可 以 被 他 所 有 的 朋友 看 到 。 
T19-9 在 Twitter 上 的 交流 发 生 在 一 个 成 员 和 他 的 朋友 之 间 。 
T19-10” 想 要 成 为 Twitter 的 成 员 ， 你 需要 登录 。 

T19-11 不 想 继续 成 为 Twitter 的 成 员 ， 你 需要 注销 。 

T19-12 在 使 用 Twitter 前 ， 你 需要 寻找 跟随 者 。 

T19-13 在 Twitter 上 ， 一 个 帖子 (信息 ) 可 以 包含 成 千 上 万 个 字符 。 
T19-14 ” 想 要 在 你 的 推 文 中 引用 其 他 人 ， 你 需要 使 用 @ 符号 。 
T19-15 想 要 在 所 有 的 推 文 中 引用 一 个 单词 ， 你 需要 使 用 标签 。 


复习 题 

Q19-1 当 考 虑 成 员 之 间 的 关系 时 ，Facebook 和 Twitter 之 间 有 何不 同 ? 

Q19-2 ” 当 考 虑 交换 的 信息 的 大 小 时 ，Facebook 和 Twitter 之 间 有 何不 同 ? 

Q19-3 解释 在 Twitter 中 ， 为 何 一 个 跟随 者 不 能 够 给 他 跟随 的 成 员 发 送 消 息 。 

Q19-4 在 Facebook 中 ， 如 果 x 和 y 是 朋友 ， 并且 z 是 x 的 朋友 却 不 是 y 的 朋友 ， 那么 x 是 否 可 以 给 z 


发 消息 呢 ? z 是 否 可 以 给 x 发 消息 呢 ? 
Q19-5 在 Twitter 中 ， 如 果 x 是 y 的 跟随 者 ，y 是 z 的 跟随 者 ，x 是 否 可 以 看 到 z 发 送 的 消息 呢 ? 


练习 题 
P19-1 在 图 19-2 中 ,假设 M2 和 M5 终结 了 他 们 的 友谊 。 对 于 这 种 新 的 情形 ， 重 新 画图 19-3。 
P19-2 在 图 19-2 中 ,假设 M3 和 M8 成 为 朋友 。 对 于 这 种 情形 ， 重 新 画图 19-3。 


P19-3 在 图 19-7 中 ,假设 M2 决定 跟随 M6。 使 用 这 种 新 的 情形 重 画 图 19-7。 
P19-4 在 图 19-7 中 ,假设 M4 跟随 了 M7， 并且 M7 跟随 了 M3。 使 用 这 种 新 的 情形 重 画 图 19-7。 
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Foundations of Computer Science, Fourth Edition 


社会 和 道德 问题 





本 章 中 ， 我 们 将 会 简要 讨论 和 计算 机 使 用 以 及 计算 机 网 络 (因特网 ) 相关 的 社会 和 道德 
问题 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 定义 和 计算 机 使 用 相关 的 三 个 道德 原则 ，; 

。 区 分 物质 财产 和 知识 产权 ， 并 列举 几 种 知识 产权 ; 


。 定义 和 计算 机 使 用 相关 的 隐私 ; 
。 给 出 计算 机 犯罪 的 定义 ， 并 讨论 几 种 攻击 以 及 攻击 的 动机 ， 以 及 如 何 防 范 攻击 ; 


。 定义 黑客 以 及 他 们 造成 的 损害 。 


20.1 道德 原则 

当 使 用 电脑 时 ， 评 判 我 们 对 世界 上 其 他 人 的 责任 的 一 
种 方式 是 将 决策 建立 在 道德 之 上 。 道 德 是 一 个 非常 复杂 的 主 
题 ， 如 果 详 细 对 其 进行 描述 那么 会 写 出 好 几 本 书 。 在 本 章 
中 ， 我 们 只 讨论 和 我 们 的 目标 相关 的 三 个 原则 ， 见 图 20-1。 ”图 20-1 道德 的 三 个 主要 原则 


20.1.1 道德 规则 


第 一 个 道德 原则 声明 ， 当 我 们 做 出 一 个 道德 决策 的 时 候 ， 需 要 考虑 决策 是 否 和 已 经 被 普 

遍 接 受 的 道德 原则 相 一 致 。 例 如 ， 如 果 我 们 想 要 非法 入 侵 电脑 来 获取 一 些 信息 ， 那 么 首先 应 

该 问 问 自己 这 种 行为 是 否 道德 。 我 们 知道 ， 世 界 上 的 大 多 数 人 不 会 认为 这 种 行为 是 道德 的 ， 
ii 

eh Ki 


“道德 的 第 一 个 原则 是 说 ， -我 们 应 该 避免 去 做 那些 违反 普遍 道德 的 行为 。 、 i a 


20.1.2 使 用 


道德 的 第 二 个 理论 涉及 行为 产生 的 后 果 。 如 果 一 个 行为 会 对 社会 有 益 ， 那 么 这 个 行为 就 
是 道德 的 。 如 果 一 个 人 人 侵 了 银行 的 计算 机 ， 并 且 抹 掉 了 客户 记录 ， 这 种 行为 是 否 对 社会 有 
用 呢 ? 由 于 这 个 行为 可 能 会 损害 银行 客户 的 财务 状态 ， 因 此 它 对 社会 有 害 。 它 不 会 导致 好 的 


结果 ， 并 且 是 不 道德 的 。 
道德 的 第 二 个 原则 是 说 ， 如 果 一 个 行为 能 够 带 来 好 的 结果 ， 那 么 这 个 行为 是 道德 的 。 


20.1.3 ”社会 契约 


社会 契约 理论 说 明 ， 当 行为 被 社会 中 的 大 部 分 人 接受 的 时 候 ， 那 么 这 个 行为 是 道德 的 。 
如 果 有 人 非法 侵入 了 他 人 的 房屋 并 且 抢 动 ， 那 么 这 种 行为 是 否 能 够 获得 社会 大 部 分 人 的 赞同 
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光 ? 答案 是 否定 的 ， 因此 这 种 行为 是 不 道德 的 。 


“ 表 和 的 第 三 个 原则 是 说 ， 如 果 个 行为 社会 中 的 大 部 分 人 护 杰 ， 北 么 这 个 行为 是 
道德 的 。 > | ts a i | 


20.2 ”知识 产权 

在 过 去 ， 大 多 数 道德 问题 和 物理 财产 相关 。 物 理财 产 已 经 被 定义 ， 并 且 在 历史 上 ， 物 理 
财产 权 已 经 被 社会 所 承认 。 如 果 一 个 人 有 一 个 物理 对 象 ， 例 如 计算 机 ， 那 么 这 个 财产 的 权利 
就 被 赋 给 了 其 拥有 者 。 忽 略 物理 财产 权 可 能 会 影响 到 上 述 讨 论 的 三 个 道德 原则 ， 这 一 点 已 经 
被 证 实 。 

现代 社会 不 断 发 展 ， 并 且 已 经 承认 了 知识 产权 。 例 如 ， 一 个 作家 应 该 被 给 予 从 上 自己 所 写 
的 书 中 获 利 的 权利 。 一 个 艺术 家 应 该 被 给 予 从 艺术 品 中 获 利 的 权利 。 然 而 ， 在 这 两 种 财产 中 
有 一 些 不 同 之 处 : 

1 ) 物理 财产 不 能 够 被 拷贝 ， 它 需要 被 制造 或 者 建造 。 如 果 我 们 需要 其 他 的 计算 机 ， 就 
需要 物理 上 建造 它 。 田 一 方面 ， 知 识 产权 可 以 被 复制 ， 我 们 不 需要 重 写 就 可 以 得 到 一 本 书 的 
副本 。 

2 ) 对 于 知识 产权 的 拷贝 仍然 会 留 给 其 拥有 者 原件 。 而 如 果 偷 走 一 台 计 算 机 ， 那 么 就 将 


它 与 其 拥有 者 分 离 了 。 
3 ) 知识 产权 的 拥有 者 是 个 人 【或 是 组 织 )， 许 多 人 可 以 拥有 同样 的 物理 财产 。 


20.2.1 知识 产权 的 类 型 


现代 社会 已 经 确认 了 几 种 类 型 的 知识 产权 : 商标 、 商 业 机 密 、 专 利和 版 权 。 

1. 商标 

商标 定义 了 公司 的 产品 或 服务 。 商 标 是 由 政府 授予 的 一 项 有 限期 限 的 知识 产权 ， 它 可 
以 被 更 新 。 商 标 被 认为 是 知识 产权 ， 因 为 在 法 律 上 相应 的 产品 不 能 被 其 他 公司 或 个 人 进行 
拷贝 。 

2. 商业 机 密 

商业 机 密 是 指 所 有 者 保密 的 关于 产品 的 机 密 信 息 。 例 如 ， 一 个 公司 可 以 制造 一 个 产品 ， 
而 保密 其 配方 。 程 序 员 可 以 创建 软件 ， 但 是 将 程序 代码 保密 。 人 们 可 以 使 用 产品 或 者 软件 ， 
但 是 他 们 并 不 拥有 那些 配方 或 代码 。 不 像 商 标 ， 商 业 机 密 不 需要 被 注册 ， 拥 有 者 需要 将 其 
保密 。 

3. 专利 

专利 是 使 用 的 专卖 权 ， 并 且 从 商业 上 讲 ， 它 在 有 限 的 时 间 内 利用 一 部 分 知识 产权 。 拥 有 
者 有 权力 决定 是 否 给 任何 希望 使 用 其 发 明 的 人 许可 。 然 而 ， 个 人 财产 需要 有 一 些 特质 ， 比 如 
新 颖 性 、 有 效 性 ， 以 及 建造 的 能 力 。 

4. 版 权 

版 权 是 对 于 已 写作 品 或 已 经 创造 的 作品 的 权利 。 它 给 予 作 者 对 于 副本 、 发 布 以 及 展示 作 
品 的 额外 的 权利 。 版 权 自 动产 生 ， 而 不 需要 被 正式 注册 ， 但 是 创造 者 的 版 权 声明 应 该 在 该 作 


品 的 某 些 地 方 被 提 及 。 
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20.3 ”隐私 

如 今 ， 公 民 的 大 量 个 人 信息 被 私有 和 公共 代理 商 所 采集 。 尽 管 在 许多 情况 下 这 种 信息 
的 采集 是 必要 的 ， 但 是 它 也 暴露 了 许多 危险 。 有 一 些 由 政府 或 私有 公司 采集 的 信息 可 以 被 商 
业 化 使 用 。 在 许多 国家 ， 公 民 的 隐私 权 在 该 国 的 机 构 中 直接 或 间接 地 提 及 。 然 而 ， 在 人 们 的 
隐私 权 和 收集 他 们 信息 的 需求 之 间 存 在 着 冲突 。 通 常 政 府 会 通过 立法 的 形式 ， 在 这 两 者 之 间 
创造 平衡 。 有 一 些 国家 已 经 引进 了 和 用 来 收集 数据 的 计算 机 的 使 用 相关 的 道德 准则 ， 如 下 
所 示 : 

1 ) 只 收集 有 必要 的 数据 。 

2 ) 确保 收集 到 的 数据 的 准确 性 。 

3 ) 允许 个 人 知道 所 收集 到 的 数据 有 了 哪些。 

4 ) 在 必要 情况 下 ， 人 允许 个 人 修改 已 收集 到 的 数据 。 

5 ) 确保 收集 到 的 数据 只 被 用 于 原来 的 目的 。 

6 ) 使 用 加 密 技术 ( 见 第 16 章 ) 来 达成 私下 的 交流 。 


20.4 计算 机 犯罪 

出 于 本 书 的 目的 ， 在 这 里 我 们 给 出 计算 机 犯罪 的 简要 定义 。 计 算 机 犯罪 是 一 种 非法 行 
为 ， 它 又 被 称 为 攻击 ， 涉 及 以 下 几 个 方面 : 

1 ) 计算 机 

2 ) 计算 机 网 络 

3 ) 和 计算 机 相关 的 设备 

4 ) 软件 

5 ) 存储 在 计算 机 上 的 数据 

6 ) 和 计算 机 使 用 相关 的 文档 


20.4.1 攻击 的 类 型 


攻击 可 以 被 分 为 两 大 类 : 入 侵 和 拒绝 服务 。 

1. 人 侵 攻 击 

这 种 情况 下 的 人 侵 意 味 着 人 侵 系统 来 获取 存储 在 计算 机 或 者 计算 机 网 络 上 的 数据 。 入 侵 
可 能 会 导致 直接 更 改 数 据 ， 或 者 释放 病毒 、 蠕 虫 或 特洛伊 木马 以 间接 更 改 数据 。 

病毒 

病毒 是 那些 潜藏 在 其 他 程序 (主机) 中 的 有 害 程 序 。 当 用 户 执行 主机 程序 的 时 候 ， 病 毒 
获得 控制 权 ， 并 通过 将 其 附着 在 其 他 程序 上 以 实现 对 自身 的 拷贝 。 最 终 ， 数 量 众多 的 病毒 可 
能 导致 停止 正常 的 计算 机 操作 。 病 毒 还 可 以 通过 计算 机 网 络 传递 给 其 他 机 器 。 

蠕虫 

蠕虫 是 一 个 独立 的 程序 ， 它 可 以 拷贝 自身 ， 并 且 通 过 网 络 进行 传播 。 它 是 一 段 能 够 自己 
复制 的 程序 ， 可 以 从 一 个 节点 传递 到 其 他 的 节点 。 蠕 虫 尝 试 找 到 系统 中 的 缺陷 来 对 系统 造成 
伤害 。 它 可 以 复制 自身 的 许多 拷贝 ， 从 而 减缓 因特网 的 访问 速度 ， 或 者 完全 阻止 通信 。 

特洛伊 木马 

特洛伊 木马 是 一 个 计算 机 程序 ， 它 能 够 合法 地 运行 ， 但 同时 也 包含 能 够 执行 恶意 攻击 
(例如 ， 删 除 或 污染 文件 ) 的 代码 。 它 还 会 被 用 作 获 取 用 户 密码 或 者 其 他 秘密 信息 。 
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2. 拒绝 服务 攻击 
拒绝 服务 是 一 种 针对 连接 因特网 的 计算 机 的 攻击 。 这 些 攻 击 降 低 了 计算 机 系统 正常 使 用 


的 性 能 ， 或 者 通过 耗 尽 其 资源 来 使 系统 崩溃 。 


20.4.2 动机 
发 动 攻击 有 许多 不 同 的 动机 ， 例 如 政治 因素 、 黑 客 个 人 对 于 计算 机 道德 的 解释 、 恐 估 主 
义 、 间 谍 、 经 济 利益 或 是 仇恨 。 


20.4.3 ”攻击 保护 
尽管 攻击 不 能 被 轻易 地 避免 ， 但 我 们 可 以 采取 一 些 策略 来 减少 攻击 的 数量 及 其 带 来 的 影 
啊 。 在 这 里 简要 列举 3 条 策略 。 


1. 使 用 物理 保护 
计算 机 可 以 被 物理 保护 。 计 算 机 只 能 被 受到 信任 的 个 人 使 用 。 


2, 使 用 受 保护 的 软件 
软件 可 以 用 来 保护 你 的 数据 ， 例 如 数据 加 密 ， 或 是 使 用 强 密码 来 使 用 软件 。 


3. 安装 强 防 病毒 软件 
强 防 病毒 软件 可 以 控制 安装 新 软件 或 访问 因特网 网 站 时 对 于 计算 机 的 访问 。 


20.4.4 花费 

显然 ， 普 通 公 民 通 常会 承担 这 些 计算 机 攻击 所 带 来 的 花费 。 当 私人 公司 在 防止 攻击 上 花 
费 金钱 时 ， 消 费 者 使 用 这 些 产 品 的 价格 也 会 增加 ; 当政 府 组 织 花 钱 来 阻止 攻击 时 ， 消 费 者 所 
付 的 税 也 会 增加 。 


20.5 黑客 
如 今 ， 黑 客 这 个 名 词 和 它 之 前 有 着 截然 不 同 的 意义 。 在 以 前 ， 黑 客 指 的 是 那些 有 着 很 多 
知识 的 人 ， 他 们 可 以 改进 系统 ， 并 且 提 升 系统 的 性 能 。 而 如 今 ， 黑 客 指 的 是 那些 未 经 授权 就 


访问 他 人 计算 机 获取 机 密 信息 的 人 。 

尽管 黑客 进行 的 人 侵 可 能 是 无 害 的 ， 但 是 大 部 分 国家 对 于 无 害 和 有 害 的 黑客 行为 都 给 予 了 
广 重 的 惩罚 。 除 此 之 外 ， 在 许多 国家 ， 对 于 那些 入侵 私 立 机 构 计算 机 的 黑客 会 给 予 严 厉 的 惩罚 。 
对 于 那些 从 他 人 计算 机 中 获取 信息 的 行为 ， 不 管 是 否 使 用 了 那些 信息 ， 该 行为 都 属于 犯罪 。 


20.6 ” 章 末 材料 
推荐 阅读 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


。 Kizza, J. M. Ethical and Social Issues in the Information Age, London: Springer, 2010 

。 Schneider, M and. Gersting, J. L. Invitation to Computer Science, 7th edition, Boston, 
MA: Cengage Learning, 2016 

* Reynold, C. and Tymann, P. Schaum s Outline of Principles of Computer Science, 


New York: McGraw-Hill, 2008 
* Long, L and Long, N. Computers, Upper Saddle River, NJ: Prentice-Hall, 1999 
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关键 术语 
copyright (版 权 ) privacy (隐私 ) 
denial of service (拒绝 服务 ) social contract (社会 契约 ) 
ethical principle (道德 原则 ) trademark (商标 ) 
hackers (黑客 ) trade secret (商业 机 密 ) 
intellectual property (知识 产权 ) Trojan horse (特洛伊 木马 ) 
moral rules (道德 规则 ) utilization (使 用 ) 
patent (专利) virus (病毒 ) 
penetration attack (人 侵 攻 击 ) worm (蠕虫 ) 

总 结 


。 当 使 用 电脑 时 ， 用 来 评估 我 们 对 于 周遭 世界 责任 的 方法 之 一 是 通过 道德 规则 、 使 用 和 


社会 契约 这 三 个 原则 来 将 我 们 的 决策 建立 在 道德 之 上 。 


。 如今 ， 道 德 问题 不 仅仅 涉及 物理 财产 ， 还 涉及 知识 产权 。 

。 四 种 不 同 的 知识 产权 是 商标 、 商 业 机 密 、 专 利和 版 权 。 

。 在 当代 ， 一 个 主要 道德 问题 是 对 隐私 的 尊重 。 

。 大 部 分 计算 机 犯罪 涉及 对 计算 机 系统 的 人 侵 ， 或 是 计算 机 系统 拒绝 服务 。 
。 计算 机 攻击 可 以 通过 物理 保护 、 保 护 性 软件 ， 以 及 防 病毒 软件 得 到 避免 。 
。 如 今 ， 术 语 黑 客 指 的 是 未 经 许可 入 侵 他 人 电脑 获取 机 密 信息 的 个 人 或 组 织 。 


20.7 练习 
小 测验 


在 本 书 网 站 上 提供 了 一 套 与 本 章 相关 的 交互 式 试 题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 完成 相关 
测验 以 检测 对 本 章 内 容 的 理解 。 


复习 题 


Q20-1 
Q20-2 
Q20-3 
Q20-4 
Q20-5 


本 章 中 所 讨论 的 道德 的 三 个 原则 是 什么 ? 

物理 财产 和 知识 产权 之 间 的 区 别 有 了 哪些 ? 

和 使 用 计算 机 相关 的 道德 隐私 法 有 哪些 ? 

当 谈 及 计算 机 犯罪 时 ， 人 侵 和 拒绝 服务 之 间 的 区 别 是 什么 ? 
非法 入侵 者 在 入侵 他 人 计算 机 时 可 以 使 用 的 三 种 方式 是 什么 ? 


练习 题 


P20-1 


P20-2 


P20-3 


P20-4 


假设 你 已 经 制造 了 一 个 软件 ， 它 可 以 被 许多 供应 商 所 使 用 。 这 项 知识 产权 是 否 被 版 权 或 是 专 
利 所 保护 ?请 解释 原因 。 

假设 你 已 经 制造 了 一 个 软件 ， 并 且 想 要 将 代码 进行 保密 。 你 是 否 需 要 登记 这 项 知识 产权 ? 请 
解释 原因 。 

如 果 有 人 收集 了 关于 你 的 数据 而 没有 事先 通知 你 ， 这 种 行为 是 否 侵犯 了 你 的 隐私 权 ? 请 解释 
原因 。 

如 果 有 人 给 你 发 了 一 封 带 有 病毒 的 电子 邮件 ， 这 属于 何 种 计算 机 犯罪 ? 请 解释 原因 。 
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P20-5 如 果 某 人 使 一 个 机 构 的 计算 机 系统 繁忙 以 致 该 系统 无 法 工作 ， 这 属于 何 种 计算 机 犯罪 ? 请 解 


释 原 因 。 
P20-6 请 说 明 病毒 和 蠕虫 之 间 的 区 别 。 
P20-7 请 说 明 病毒 和 特洛伊 木马 之 间 的 区 别 。 
P20-8 请 说 明 蠕 虫 和 特洛伊 木马 之 间 的 区 别 。 
P20-9 描述 可 以 防止 计算 机 遭受 攻击 的 不 同 的 方式 。 
P20-10 解释 黑客 可 能 会 对 金融 机 构 的 计算 机 系统 造成 的 损坏 。 


附录 A | 


Foundations of Computer Science, Fourth Edition 


Unicode 


计算 机 使 用 的 是 数字 ， 它 们 通过 给 字符 赋 一 个 数字 值 来 储存 字符 。 最 早 的 编码 系统 称 为 
ASCII ( American standard code for information interchange， 美 国标 准 信息 交换 码 )， 其 中 有 
128 个 字符 ， 每 一 个 字符 用 7 位 二 进 制 数 来 存储 。ASCII 能 很 好 地 处 理 小 写字 母 、 大 写字 母 、 
数字 、 标 点 符号 和 一 些 控制 字符 。 后 来 又 把 ASCII 字符 集 扩 充 为 8 位， 新 的 编码 称 为 扩展 
ASCII， 它 不 再 是 国际 标准 了 。 

为 了 克服 ASCII 和 扩展 ASCII 中 国有 的 困难 (没有 足够 的 位 数 来 表示 其 他 语言 通信 中 
需要 的 字符 和 符号 )，Unicode 协会 (一 个 多 种 语言 软件 制造 团体 ) 建立 了 一 个 通用 的 编码 系 
统 ， 提 供 全 面 的 字符 集 ， 称 为 Unicode (统一 字符 编码 )。 

起 初 , Unicode 是 2 字 节 字符 集 ， 后 来 ，Unicode 第 5 版 改 成 了 4 字 节 编码 ， 并 与 ASCII 
和 扩展 ASCII 完全 兼容 。ASCII 现在 称 为 基本 Latin， 它 的 Unicode 码 中 高 25 位 设 为 0; 扩 
展 ASCII 现在 称 为 Latin-1， 它 的 Unicode 码 中 高 24 位 设 为 0。 图 A-1 显示 了 不 同系 统 是 如 


何 兼容 的 。 
扩展 ASCII 
| 定义 平面 ] ASCII 
| Unicode | 


图 A-1 Unicode 兼容 性 





在 Unicode 中 ， 每 个 字符 或 符号 被 定义 成 32 位 的 数字 。 这 种 编码 能 定义 2* (4294 967 296 ) 
个 字符 或 符号 。 这 里 用 如 下 格式 的 十 六 进 制 数字 来 描述 。 其 中 每 个 X 代表 一 个 十 六 进 制 数 。 


DU+XXXXXXXX 


A.1 平面 

Unicode 把 整个 编码 空间 分 割 成 平面 。 最 高 的 16 位 定义 平面 ， 这 意味 着 我 们 有 65 536(2 9) 
个 平面 。 对 于 平面 0， 最 高 的 16 位 全 是 0， 即 (0000)ie, 平面 1 是 (0001)ie, 平面 2 是 (0002)is， 
等 等 ， 直 到 平面 65 536， 它 是 (CEFFF)ie。 每 个 平面 能 定义 65 536 个 字符 或 符号 。 图 A-2 显示 
了 Unicode 编码 空间 的 结构 和 平面 。 


A.1.1 基本 多 语言 平面 (BMP ) 

基本 多 语言 平面 (平面 0) 是 用 来 与 先前 16 位 Unicode 兼容 的 。 在 这 个 平面 中 最 高 的 16 
位 全 设 为 0。 编码 通常 显示 成 U+XXXX 的 形式 ， 其 中 的 XXXX 是 低 16 位 。 这 个 平面 大 多 用 
来 定义 不 同 语言 中 的 字符 集 ， 除 了 少数 控制 代码 或 特殊 字符 代码 (更 多 信息 ， 请 参见 Unicode 
网 页 )。 
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0000: 基本 多 语言 平面 (BMP) 000E: 辅助 特殊 平面 (SSP) 
0001: 辅助 多 语言 平面 (SMP) 000F: 私有 用 户 平面 (PUP) 
0002: 轴 助 象形 文字 平面 (SIP) 0010: 私有 用 户 平面 (PUP) 


图 A-2 Unicode 平面 


A.1.2 其 他 平面 
Unicode 还 有 其 他 平面 : 
。 辅助 多 语言 平面 (平面 (0001)ik ) 用 来 为 那些 没有 包含 在 BMP 平面 中 的 多 语言 字符 提 


供 更 多 的 编码 。 

。 辅助 象形 文字 平面 (平面 (0002)1e ) 用 来 为 象形 文字 提供 编码 ， 这 些 文字 像 声 音 或 发 
音 一 样 表示 一 种 思想 或 意思 。 

。 辅助 特殊 平面 (平面 (000E)ie ) 用 来 表示 不 在 基本 Latin 和 Latin-1 中 的 特殊 字符 。 

。 私有 用 户 平 面 (平面 (000F)is 和 平面 (0010)is ) 为 私有 用 户 预 留 。 


A.2 ASCIll 


如 今 ， 


ASCII 或 基本 Latin 都 是 Unicode 的 一 部 分 。 它 占据 了 Unicode 中 的 前 128 个 编 


码 (U-00000000 到 U-0000007F)。 表 A-1l 包含 了 十 六 进 制 编码 和 符号 。 要 找到 实际 的 编码 ， 
要 把 (000000)is 加 到 各 个 编码 的 前 面 。 


二 
(00)'s 
(01)is 
(02)'s 
(03)'s 
(04)is 
(05)ie 
(06)'s 
(07)'s 
(08)is 
(09)ie 
(0A)is 


表 A-1 ASCII 


on | eo | mw | on | ms | eo. 
EE 
or | ep | on | ss | es 
me | om | ve | om | os | Go 
om oe | om | we 


|| 


“| 外 | 并 | | 洪 


Na | A 


关 


+ 





















( 续 ) 


A.2.1 ASCII 的 一 些 特性 


ASCI 具有 一 些 有 趣 的 特性 ， 这 里 简单 介绍 一 下 : 

1 ) 第 一 个 编码 (00)ie 是 一 个 不 可 打印 字符 ， 也 是 一 个 空 字 符 。 它 表示 不 是 任何 字符 。 

2 ) 最 后 一 个 字符 (7F)ie 是 一 个 删除 字符 ， 也 是 一 个 不 可 打印 字符 。 有 些 程 序 用 这 个 字 
符 来 删除 当前 字符 。 

3 ) 空格 字符 (20)i6 是 一 个 可 打印 字符 ， 它 打印 一 个 空格 。 

4 ) 编码 (01)is 到 (1F)ie 的 字符 是 控制 字符 ， 它 们 不 可 打印 ， 表 A-2 显示 了 它们 的 功能 ， 


这 个 字符 中 的 大 部 分 用 在 过 时 协议 的 数据 通信 中 。 
表 A-2 控制 字符 的 解释 


Ex 有 
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( 续 ) 
HH | Wm | FW | mw 
Eo Rn rr 


mo | wr | | 
到 本 
TI 
a enn 而 


po | ak | ay | AR 
| ak | sa | 扣 

到 区 TT 

pr | iM | | 
We | Hmm | | 
sm | mam | 
ET? 


5 ) 大 写字 母 从 (41)i 开始 ， 小 写字 母 从 (61)is 开始 。 当 进行 数字 上 的 比较 时 ， 大 写字 
母 小 于 小 写字 母 ， 这 意味 着 当 我 们 基于 ASCII 值 排序 一 个 表 时 ， 大 写字 母 将 显示 在 小 写字 
母 之 前 。 

6 ) 大 写字 母 和 小 写字 母 在 7 位 编码 中 只 有 一 位 是 不 同 的 。 例 如 ， 字 符 A 是 (41)is。， 而 a 
是 (61)ie， 不 同 的 位 是 第 6 位 ， 它 在 大 写字 母 中 是 0， 而 在 小 写字 母 中 是 1。 如 果 我 们 知道 一 
种 写法 的 编码 ， 可 以 很 容易 地 找到 男 一 种 写法 的 编码 ， 通 过 在 十 六 进 制 数 上 加 减 (20)is， 或 反 
转 第 6 位 。 换 言 之， 字符 A 的 编码 是 (41)is =(1000001),， 字 符 a 的 编码 是 (61)ie = (1100001);， 
二 进 制 数 中 的 第 6 位 从 0 反 转 成 1。 

7 ) 大 写字 母后 面 不 是 紧 跟 着 小 写字 母 的 ， 这 其 中 有 些 标点 字符 。 

8 ) 十 进 制 数字 (0 一 9 ) 从 (30)is 开始 ， 这 意味 着 如 果 我 们 要 把 一 个 数字 字符 转化 为 它 对 
应 的 作为 整数 的 值 ， 我 们 需要 从 中 减 去 (30)ie =48。 例 如 ，8 在 ASCI 中 的 编码 是 (38)ie = 56， 
要 找到 它 所 对 应 的 值 ， 我 们 需要 从 中 减 去 48， 即 56-48=8。 


附录 了 | 


Foundations of Computer Science, Fourth Edition 


UML 


统一 建 模 语言 (Unified Modeling Language，UML) 是 一 种 用 来 进行 分 析 和 设计 的 图 形 
化 语言 。 通 过 UML， 我 们 可 以 用 标准 的 图 形 概 念 来 说 明 、 可 视 化 、 构 造 和 用 文档 说 明 软 件 
和 硬件 系统 。UML 提供 了 不 同 层次 的 抽象 ， 称 为 视图 ， 如 图 B-1 所 示 。 






口 类 图 


口 用 例 图 EE 口 协作 图 口 组件 图 
口 顺序 图 口 配 置 图 
口 状态 图 
口 活动 图 
图 B-1 UML 视图 


图 B-1 中 的 4 个 视图 是 : 
1 ) 用 户 视 图 ， 它 显示 用 户 与 系统 间 的 交互 ， 这 个 视图 用 用 例 图 来 表示 。 

2 ) 结构 视图 ， 它 显示 了 系统 的 静态 结构 ， 这 个 视图 用 类 图 来 表示 。 ， 

3 ) 行为 视图 ， 它 显示 了 对 象 在 系统 中 的 行为 ， 这 个 视图 用 协作 图 、 顺 序 图 、 状 态 图 和 


活动 图 来 表示 。 
4 ) 实现 视图 ， 它 显示 系统 是 如 何 实现 的 ， 它 包含 组 件 图 和 配置 图 。 


B.1 用 户 视 图 
用 户 视图 是 整个 系统 的 高 层 视图 ， 它 显示 系统 在 总 体 上 是 如 何 组 织 的 。 在 用 户 视图 中 只 
有 一 种 图 一 一 用 例 图 。 


B.1.1 用 例 图 


一 个 工程 通常 是 从 用 例 图 开始 的 ， 用 例 图 给 
出 了 系统 的 用 户 视 图 : 它 显 示 了 用 户 是 如 何 与 系 
统 通 信 的 。 图 B-2 显示 了 一 个 用 例 图 的 例子 。 用 2 
例 图 使 用 4 个 主要 的 组 成 部 分 : 系统 、 用 例 、 行 ”教授 
动 者 和 关系 ， 每 个 组 成 部 分 解释 如 下 。 查看 成 绩 

1. 系统 

系统 执行 一 个 功能 ,我们 只 对 计算 机 系统 感 
兴趣 。 在 用 例 图 中 的 计算 机 系统 用 和 矩形 框 显 示 ， 
在 框 外 左上 角 标 上 系统 的 名 字 。 


成 绩 系 统 


性 
峰 





记录 成 绩 
管理 员 
图 B-2 用 例 图 


UML 377 





2. 用 例 
系统 包含 许多 表示 成 用 例 的 行为 。 每 个 用 例 定义 了 一 个 能 被 系统 用 户 所 采取 的 行为 。 在 


用 例 图 中 用 带 圆 角 的 矩形 表示 用 例 。 


3. 行动 者 

行动 者 是 使 用 系统 的 某 人 或 某 事 。 虽 然 行动 者 是 以 棍 状 轮廓 来 显示 ， 但 它们 并 不 必要 代 
表 人 类 。 

4. 关系 


关系 是 行动 者 和 用 例 间 的 联系 。 关 系 是 用 行动 者 到 用 例 间 的 连 线 来 表示 的 。 一 个 行动 者 
可 以 关联 多 个 用 例 ， 同 样 一 个 用 例 可 以 被 多 个 行动 者 关联 。 


B.2 结构 视图 
结构 视图 显示 了 系统 、 类 和 它们 的 关系 等 静态 特性 。 结 构 视图 用 一 种 图 来 表示 : 类 图 。 


B.2.1 类 图 
类 图 表明 系统 的 静态 结构 ， 它 显示 了 类 的 特性 和 类 间 的 关系 。 类 的 符号 是 一 个 把 类 名 写 
在 里 面 的 矩形 。 图 B-3 显示 了 属于 不 同系 统 的 本 且 弄 下 
图 B-3 类 的 符号 


三 个 类 : 人 、 分 数 和 电梯 ， 这 就 是 说 它们 之 间 
没有 任何 关系 。 

拓 图 通过 对 图 增加 属性 、 类 型 和 方法 得 到 扩展 。 类 间 的 关系 用 联合 图 和 泛 化 图 来 显示 。 
1. 属性 和 类 别 


类 符号 可 以 包含 在 分 离间 隔 间 中 的 属性 和 类 型 ， 属 性 是 一 个 类 的 特性 ， 类 型 用 来 表示 这 
个 属性 值 的 数据 类 型 。 图 B-4 显示 了 人 和 分 数 这 两 个 类 的 一 些 属性 。 








Fractioll 


numerator: integer 
age: integer 


图 B-4 加 到 类 符号 中 的 属性 


Person 
name: string 
age: integer 

2. 方法 


类 也 可 以 被 扩展 成 包含 方法 。 方 法 就 是 一 个 能 被 对 象 (类 的 一 个 实例 ) 使 用 或 应 用 到 一 
个 对 象 上 的 过 程 。 换 言 之 ， 一 个 对 象 既 是 行为 者 ， 也 是 接受 者 。 图 B-5 显示 了 两 个 带 有 属性 


和 方法 的 类 。 属 性 和 方法 被 列 在 分 离 的 间隔 间 中 。 





| | 


Fractioy 


numeraor: integer 
denominator: integer 


Person 


name: string 


age: integer 


printName Dirint 





incrementAge add 





图 B-5 加 到 类 符号 中 的 属性 和 方法 


了 78 诗 爱 BB 


3. 关联 
关联 是 两 个 类 间 的 概念 上 的 关系 。 关 联 用 两 个 类 间 的 实 线 来 显示 。 如 果 关 联 有 名 字 ， 那 


它 被 写 在 线 的 旁边 ， 并 带 上 实心 箭头 。 

关联 可 以 是 : 一 对 一 、 一 对 多 、 多 对 一 或 多 对 多 。 图 B-6 显示 了 4 个 类 和 它们 间 的 一 些 
关联 。 它 显示 一 个 教授 (教授 类 的 一 个 对 象 ) 可 以 教 1 一 5 门 课 程 〈1..5 )。 相 反 ， 在 这 个 例 
子 中 ， 一 门 课程 只 能 有 一 位 教授 。 大 学 (大 学 类 的 一 个 对 象 ) 可 以 有 许多 教授 和 和 学生 (学生 
类 的 对 象 )， 在 关联 线 上 用 星 号 (*) 指示 。 图 中 还 显示 了 一 个 学 生 可 以 选 多 门 课 程 。 


Office 


Student 





University 


图 B-6 类 间 的 关联 


4. 这 化 
泛 化 基于 类 间 的 相似 性 和 差异 来 组 织 类 。 泛 化 允许 我 们 定义 子 类 和 超 类 。 子 类 继承 了 它 


所 有 的 超 类 的 特性 (属性 和 方法 )， 但 通常 它 有 自己 的 一 些 特性 (属性 和 方法 )。 图 B-7 显示 
了 单 继承 和 多 继承 。 
超 类 : 超 类 超 类 





子 类 子 类 
a ) 两 个 子 类 继承 一 个 超 类 
图 B-7 泛 化 (继承) 


b ) 一 个 子 类 继承 两 个 超 类 


B.3 行为 视图 
行为 视图 显示 系统 中 的 对 象 行为 。 取 决 于 行为 的 种 类 ， 有 4 类 不 同 的 图 : 协作 图 、 状 态 
图 、 顺 序 图 和 活动 图 。 


B.3.1 协作 图 
协作 图 与 类 图 相似 。 区 别 在 于 类 图 显示 了 类 间 的 关系 ， 而 协作 图 显示 了 对 象 (类 的 实 


例 ) 间 的 关系 。 
从 类 实例 化 的 任何 对 象 也 可 以 用 和 矩形 表示 ， 甜 形 里 写 着 对 象 的 名 字 ， 后 面 跟着 冒号 和 类 


的 名 字 。 对 于 匿名 的 对 象 ， 对 象 的 名 字 被 省 去 。 图 B-8 显示 了 从 类 Person 实例 化 的 三 个 对 象 。 


Anne:Person Person 





“John:Person 


a ) 一 个 名 为 John 的 对 象 b ) 一 个 名 为 Anne 的 对 象 c ) 一 个 匿名 对 象 
图 B-8 从 同一 类 实例 化 的 三 个 对 象 


UML 379 





1. 属性 和 值 
属性 是 类 的 特性 ， 而 值 是 对 象 对 应 属性 的 特性 。 对 象 符号 可 以 包含 值 。 图 B-9 显示 了 类 
Person 和 Fraction 的 一 些 属 性 和 在 类 中 这 些 属 性 的 值 。 





a ) Person 的 对 象 b ) Fraction 的 对 象 
图 B-9 属性 和 值 的 例子 


2. 方法 和 操作 

虽然 对 象 符号 也 可 以 包含 方法 和 操作 ， 但 在 协作 图 中 并 不 常见 。 

3. 链接 

在 协作 图 中 ， 链 接 是 类 图 中 关联 的 一 个 实例 。 对 象 可 以 使 用 链接 与 其 他 对 象 关联 。 用 
两 个 原型 记号 来 表示 链接 : 本 地 和 参数 。 第 一 个 显示 一 个 对 象 把 另外 一 个 对 象 当成 局 部 变量 
来 使 用 ; 第 二 个 显示 一 个 对 象 把 另外 一 个 对 象 当 作 参 数 来 使 用 。 多 样 性 (在 图 B-6 中 学 生 和 
课程 间 的 关联 显示 的 ) 也 可 以 用 多 重合 的 对 象 来 表示 。 多 样 性 也 可 以 在 同一 类 对 象 间 显示 。 
图 B-10 显示 了 学 生 对 象 使 用 多 门 课程 作为 参数 。 

4. 消息 

一 个 对 象 可 以 向 另外 一 个 对 象 发 送 消息 。 消 息 可 以 表示 从 一 个 对 象 发 送 到 另外 一 个 对 
象 的 事件 。 消 息 也 可 以 调用 另外 一 个 对 象 中 的 方法 。 最 后 ， 对 象 可 以 使 用 消息 创建 或 销毁 
尺 外 一 个 对 象 。 消 息 用 箭头 来 表示 ， 箭 头 代表 了 消息 的 方向 ， 显 示 在 对 象 间 的 链接 上 面 。 
图 B-11 显示 了 一 个 Editor 对 象 向 Printer 对 象 发 送 了 一 个 打印 的 消息 。 


人 


图 B-10 对 象 之 间 的 链接 图 B-11 从 一 个 对 象 发 送 到 另 一 个 对 象 的 消息 


B.3.2 状态 图 

状态 图 用 来 显示 单个 对 象 在 状态 上 的 变化 。 对 象 在 响应 一 个 事件 时 会 引起 状态 上 的 变 
化 。 例 如 ， 当 一 个 开关 被 打开 时 ， 它 的 状态 就 从 关 变 成 了 开 。 一 台 洗 衣 机 在 响应 定时 器 的 触 
发 时 ， 可 能 会 从 洗涤 状态 到 漂洗 状态 。 


1. 符号 
状态 图 主要 使 用 三 种 符号 ， 如 图 B-12 所 示 。 





图 B-12 ”状态 图 中 使 用 的 符号 


状态 
有 三 个 符号 表示 状态 : 开始 状态 、 停 止 状态 和 中 间 状 态 。 开 始 状 态 被 画 成 黑 圆圈 ， 名 字 


写 在 圆圈 的 旁边 ， 在 图 中 只 允许 一 个 。 停 止 状 态 被 画 成 一 个 实心 的 黑 圆 圈 ， 在 另外 一 个 圆圈 
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的 里 面 ， 在 图 中 可 以 重复 。 中 间 状 态 被 画 成 圆 角 的 矩形 ， 状 态 的 名 字 在 和 矩形 里 面 。 


转换 
在 状态 图 中 ， 转 换 是 状态 间 的 运动 。 转 换 符 号 是 两 个 状态 间 的 带 箭 头 的 线 。 箭 头 显示 了 


下 一 个 状态 。 离 开 一 个 状态 的 转换 有 一 个 或 多 个 ， 到 达 一 个 状态 的 转换 只 能 是 一 个 


决策 点 
决策 点 用 菱形 来 表示 ， 基 于 对 象 中 的 数据 或 条 件 转换 可 以 走 多 条 路 径 。 


2. 事件 
在 状态 图 中 ， 对 象 能 被 一 个 事件 般 发 ， 该 事件 可 以 是 外 部 的 或 内 部 的 。 例 如 ， 当 一 个 开 


关 被 打开 时 ， 它 就 从 关 状 态 切换 到 开 状 态 。 事 件 用 字符 串 来 表示 ， 该 字符 串 定 义 了 处 理 这 个 
事件 类 中 的 操作 。 它 可 能 有 括号 ， 包 含 传递 给 操作 的 形式 参数 。 事 件 也 可 以 有 括 在 括号 中 的 
条 件 。 下 面 显 示 了 一 个 事件 的 例子 : 


withdraw (amount) [amount<balance] 
当 被 一 个 事件 触发 时 ， 一 个 对 象 可 能 或 可 能 不 转 到 男 一 个 状态 。 
3. 动作 
虽然 动作 能 被 多 种 方法 触发 ， 但 我 们 只 提 到 动作 被 事件 触发 。 动 作用 字符 串 来 表示 ， 它 
通常 定义 另外 一 个 对 象 和 被 这 个 对 象 调用 的 事件 。 如 果 目 标 对象 需 要 人 参数， 它们 被 括 在 括号 
里 。 动 作用 斜 杠 〈/) 与 事件 分 开 ， 下 面 显示 了 一 个 动作 的 例子 : 
deposit (amount) / add (balance) 
| 
事件 动作 
图 B-13 显示 了 状态 图 的 一 个 简单 的 例子 。 这 里 有 6 个 状态 (开始 状态 、 停 止 
状态 和 4 个 中 间 状 态 )、9 个 事件 和 4 个 动作 。 





图 B-13 ”状态 图 的 一 个 例子 


B.3.3 顺序 图 

顺序 图 显示 了 对 象 (或 行动 者 ) 间 在 一 段 时 间 内 的 交互 。 在 顺序 图 中 ， 对 象 (或 行动 者 ) 
作为 列 被 列 出 ， 而 时 间 在 概念 上 是 向 下 流 的 ， 用 垂直 的 虚线 表示 。 

符号 

顺序 图 主要 使 用 5 种 符号 ， 如 图 B-14 所 示 。 

行动 者 

行动 者 的 符号 是 我 们 在 用 例 图 中 使 用 的 同样 的 棍 状 轮廓 。 有 既然 行动 者 也 能 与 对 象 通信 ，， 
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那 它 就 是 顺序 图 的 一 部 分 。 


行动 者 


:GDjgc 一 
大 | = 
线 。 激活 


生命 
图 B-14 顺序 图 中 的 符号 


对 象 

对 象 (就 像 我 们 先前 见 到 的 一 样 ) 是 类 的 实例 ， 顺 序 图 表示 了 对 象 间 的 交互 。 

生命 线 

生命 线 用 垂直 的 实 线 或 虚线 表示 ， 表 示 顺 序 图 中 的 一 个 个 体 参与 者 。 它 通常 顶 一 个 矩形 
作为 头 ， 和 矩形 中 含有 对 象 的 名 字 或 行动 者 。 垂 直线 代表 了 对 象 的 生命 期 限 ， 一 直 延 伸 到 对 象 
不 再 活动 的 那个 点 。 

激活 

激活 用 窄 的 实心 矩形 表示 ， 显 示 了 当 一 个 对 象 在 一 个 活动 中 被 调用 的 时 间 ， 也 就 是 它 
非 空 闲 时 。 例 如 ， 如 果 一 个 对 象 向 男 外 一 个 对 象 发 送 了 一 个 消息 ， 正 等 待 响应 ， 在 这 段 时间 
内 ， 对 象 被 调用 。 

消息 

消息 用 带 箭头 的 线 表示 ， 显 示 了 对 象 (行动 者 ) 间 的 交互 。 

图 B-15 显示 了 顺序 图 的 一 个 简单 例子 ， 该 例子 中 有 一 个 行动 者 和 三 个 匿名 对 
象 ， 图 中 也 显示 了 并 发 : 第 一 个 对 象 在 收 到 第 一 条 消息 后 ， 并 发 地 送出 两 条 消息 ， 一 条 给 行 


动 者 ， 另 一 条 给 第 二 个 对 象 。 
:ClassB Lesc 


行动 者 :ClassA 
' ' 
' ' 
. ' 
' 








图 B-15 顺序 图 的 一 个 例子 


B.3.4 活动 图 

活动 图 显示 了 一 个 复杂 操作 的 分 解 或 一 个 过 程 分 解 成 一 组 简单 的 操作 和 过 程 。 活 动 图 
比 顺序 图 更 详细 。 顺 序 图 强调 对 象 ， 而 活动 图 显示 的 是 由 一 个 或 多 个 对 象 进行 的 更 详细 的 操 
作 。 在 面向 对 象 的 程序 设计 中 的 活动 图 代替 了 过 程 程序 设计 中 的 传统 的 流程 图 。 但 是 ， 传 统 
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的 流程 图 只 能 显示 顺序 流 控制 ( 串 行 )， 而 活动 图 既 能 显示 顺序 流 控制 ， 又 能 显示 并 发 (并 


行 ) 流 控 制 。 
符号 
活动 图 主要 使 用 6 种 符号 ， 如 图 B-16 所 示 。 
搁 开始 点 SS 决策 (分 支 或 融合 ) 活动 
® 终止 点 《一 一 一 一 转 境 一 一 一 分 叉 或 连接 
图 B-16 活动 图 中 使 用 的 符号 
活动 


活动 是 活动 图 中 的 一 步 。 我 们 用 圆 角 的 矩形 表示 一 个 活动 ， 活 动 的 名 字 在 矩形 框 内 。 一 
个 活动 的 详细 程度 应 该 与 整个 图 一 致 ， 如 果 对 某 个 活动 需要 更 详细 的 信息 ， 那 就 需要 画 个 新 


的 图 来 表示 。 

转换 

与 状态 图 相似 ， 活 动 图 中 的 转换 用 带 箭头 的 线 表示 ， 箭 头 表 示 了 动作 的 方向 。 

开始 点 和 终止 点 

活动 图 中 的 开始 点 是 一 个 带 单个 向 外 转换 的 实心 圆圈 ; 终止 点 是 带 有 单个 向 内 转换 的 一 
个 被 空心 圆 包围 的 实心 圆 (公牛 眼 )。 图 中 只 能 有 一 个 开始 点 ， 而 逻辑 上 也 应 该 只 有 一 个 终 
止 点 ， 但 为 了 图 的 可 读 性 ， 多 个 终止 点 是 允许 的 。 


决策 和 融合 
一 个 萎 形 表示 一 个 决策 或 融合 。 转 换 可 以 根据 条 件 走 多 条 路 径 。 当 作为 一 个 决策 点 来 使 


用 时 ， 菱 形 符号 只 能 有 一 个 入 口 ， 两 个 或 多 个 出 口 ; 当 作为 融合 点 来 使 用 时 ， 萎 形 符号 有 两 
个 或 多 个 人 口 ， 但 只 能 有 一 个 出 口 。 

分 叉 或 连接 

一 条 加 粗 线 表示 并 行 处 理 中 的 分 叉 或 连接 。 分 叉 符号 表示 两 个 或 多 个 线程 的 开始 ， 而 连 


接 符号 表示 线程 的 结束 。 
区 有 这 光 图 B-17 显示 了 活动 图 的 一 个 例子 ,活动 2 和 活动 3 是 并 发 执行 的 (并 行 处 理 )。 








图 B-17 活动 图 的 一 个 例子 
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B.3.5 ” 泳 道 
有 时 活动 图 中 的 操作 是 由 不 同 对 象 或 行动 者 来 进行 的 。 为 了 显示 涉及 多 个 对 象 或 行动 
者 ， 泳 道 被 加 进 活 动 图 中 ， 如 图 B-18 所 示 。 





图 B-18 带 有 瀛 道 的 活动 图 


B.4 实现 视图 
实现 视图 显示 最 终 产品 是 如 何 实现 的 。 有 两 种 图 用 来 显示 实现 : 组 件 图 和 配置 图 。 


B.4.1 组 件 图 

组 件 图 显示 了 软件 的 组 成 部 分 (组 件 ) 和 它们 之 间 的 依赖 关系 。 组 件 用 带 有 两 个 小 矩形 
在 其 左边 上 的 和 矩形 来 表示 。 组 件 间 的 依赖 用 末端 有 箭头 的 虚线 表示 。 我 们 也 可 以 在 依赖 线 上 
使 用 老式 表示 法 ， 包 括 老 式 的 关系 ， 如 <<report>>。 图 B-19 显示 了 一 个 组 件 图 。 





图 B-19 组 件 图 的 一 个 例子 


B.4.2 配置 图 


配置 图 显示 了 通信 和 链接 的 各 个 节点 。 
节点 用 立方 体 来 表示 ， 通 信和 联合 用 两 个 节点 
间 的 连 线 表示 。 一 个 节点 可 以 包含 一 个 或 多 
个 组 件 。 图 B-20 显示 了 一 个 简单 的 配置 图 。 图 B-20 配置 图 的 一 个 例子 
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伪 代 码 


定义 算法 最 常用 的 工具 之 一 是 伪 代 码 。 伪 代码 是 算法 所 需 的 一 种 类 似 英 语 的 代码 表示 形 
式 。 它 是 部 分 英语 和 部 分 结构 化 代码 的 组 合 。 英 文 代码 部 分 支持 宽松 的 语法 格式 ， 并 很 容易 
被 读 懂 。 代 码 部 分 包含 基本 算法 结构 的 扩充 版 本 : 顺序 、 选 择 和 循环 。 算 法 C.1 给 出 了 伪 代 
码 的 一 个 例子 。 我 们 简单 地 讨论 一 下 这 一 节 的 组 成 部 分 。 


算法 C.1 伪 代 码 的 一 个 例子 


算法 ; FindingSmallest (1ist) 

目的 ; 这 个 算法 用 来 在 一 系列 数 中 找 最 小 值 
前 提 :; 一 列 数字 

后 续 : 无 

返回 : 数列 中 的 最 小 值 


smallest + 一 first number 
loop ( not end of list) 
{ 
if (next number < smallest) 
{ 
smallest +4— second number 
) 
} 


return value of smalillest 





C.1 组 成 部 分 
伪 代 码 中 的 算法 可 分 解 为 若干 元 素 和 结构 。 


C.1.1 算法 头 


每 种 算法 都 有 一 个 算法 头 来 命名 其 本 身 。 例 如 ， 算 法 C.1 的 算法 头 是 以 Algorithm 开始 ， 
后 面 跟 算法 的 名 字 “FindingSmallest”。 


C.1.2 目的 、 条 件 和 返回 值 


定义 了 算法 头 之 后 ， 一 般 情 况 应 继续 写 出 目的 、 前 提 条 件 和 后 续 条 件 ， 以 及 此 算法 中 返 
回 的 数据 。 


1. 目的 
目的 是 有 关 算 法 要 完成 什么 的 简短 语句 。 它 只 是 在 通常 的 算法 进程 中 被 描述 ， 并 非 所 有 


的 算法 进程 。 目 的 语句 以 Purpose 开始 ， 接 下 来 是 算法 目的 。 


2. 前 提 条 件 
前 提 条 件 列 出 了 算法 的 所 有 前 驱 需 求 。 例 如 ， 算 法 C.1 中 ， 我 们 需要 一 串 算法 可 用 的 


序列 。 
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3. 后 续 条 件 

后 续 条 件 指出 了 算法 产生 的 影响 。 例 如 ， 也 许 算法 会 指明 打印 数据 清单 。 

4. 返回 值 

我 们 认为 每 个 算法 应 该 指出 算法 返回 的 结果 。 如 果 没 有 要 返回 的 值 ， 则 要 指明 无 返回 
值 。 算 法 C.1 中 的 返回 值 为 序列 中 的 最 小 值 。 

5. 语句 

语句 是 像 算法 C.1、C.2、C.3、C.4 中 的 那些 赋值 、 输 入 、 输 出 、 条 件 和 循环 语句 。 堆 
套 语 句 (在 其 他 语句 中 的 语句 ) 是 缩 进 的 。 髓 套 语句 的 列表 是 以 开 括 号 ( 花 括号 ) 开始 ， 以 
闭 括号 结束 。 整 个 参数 是 算法 自身 的 一 个 垦 套 语句 列表 。 由 于 这 个 原因 ， 我 们 看 到 开始 处 有 
一 个 开 括号 ， 结 尾 处 有 一 个 闭 括号 。 


C.1.3 语句 结构 


Niklaus Wirth 首次 提出 结构 编程 模型 时 ， 他 指出 任何 算法 都 仅 包含 三 种 程序 结构 : 顺 
序 、 选 择 和 循环 。 所 以 伪 代 码 也 只 包含 这 三 种 基本 结构 。 这 些 结构 的 实现 依赖 于 丰富 的 实现 
语言 。 例 如 ，C 语言 中 的 循环 可 能 会 用 while、do-while 或 for 来 实现 。 

1. 顺序 

算法 中 的 一 系列 顺序 语句 是 不 会 改变 执行 路 径 的 。 像 赋值 和 加 法 等 语句 显然 是 顺序 执行 
的 语句 ， 而 对 其 他 算法 的 调用 虽然 也 认为 是 顺序 语句 ， 但 却 不 是 显而易见 的 。 原 因 在 于 结构 
化 编程 的 定义 是 每 个 算法 仅 有 一 个 人 口 和 一 个 出 口 。 其 次 ， 当 算法 完成 时 ， 会 立即 返回 到 原 
程序 继续 执行 。 因 此 你 可 以 认为 该 算法 调用 的 是 一 个 顺序 语句 ， 如 算法 C.2 所 示 。 


算法 C.2 顺序 的 例子 


X + first number 
y 0 Second number 
Z XX y 

call Argument X 


2. 选择 
选择 语句 计算 一 个 或 多 个 选项 。 如 果 值 为 真 ， 则 选择 该 路 径 执 行 。 反 之 ， 选 择 另 外 的 路 
径 。 经 典 的 选择 语句 是 双 路 选择 (if-else)。 然 而 ， 多 数 的 语言 提供 多 路 选择 ， 伪 代码 中 却 不 
提供 。 选 择 分 支 用 缩 进 的 方式 标记 ， 如 算法 C.3 所 示 。 
算法 C.3 ”选择 的 例子 


Tf (XKy) 

{ 
Increment x 
Print x 

} 

Else 

{ 
Decrement y 
Print y 

} 


3. 循环 
循环 是 指 代码 块 的 重复 执行 。 伪 代码 中 的 循环 类 似 while 循环 。 它 是 一 种 先 测试 循环 ; 
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也 就 是 说 ， 在 循环 主体 执行 前 先进 行 条 件 测试 。 如 果 条 件 为 真 ， 则 执行 循环 ; 如 果 条 件 为 
假 ， 则 循环 中 断 。 算 法 C.4 是 一 个 循环 的 例子 。 


算法 C.4 ”循环 的 例子 


Loop (more iines in the file Filel) 
{ 

Read next line 

Delete the leading space 

Copy the line to File2 
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结 构图 
结构 图 是 面向 过 程 软件 设计 阶段 的 主要 工具 。 作 为 一 个 设计 工具 ， 它 在 你 写 程序 之 前 被 创建 。 
D.1 结构 图 符号 
图 D-1 给 出 了 结构 图 中 使 用 的 各 种 符号 。 
D.1.1 模块 符号 


结构 图 中 的 每 一 个 和 矩形 代表 编写 的 一 个 模块 。 和 矩形 的 名 字 就 是 它 所 代表 的 模块 的 名 字 。 


(图 D-2 )。 
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图 D-1 结构 图 符号 图 D-2 结构 图 的 一 个 例子 


D.1.2 结构 图 中 的 选择 


图 D-3 给 出 了 两 个 被 选择 语句 所 调用 的 模块 符号 : 条 件 和 异 或 。 

D-3a 中 ， 模 块 A 包含 了 对 子 模块 fun 的 条 件 调用 ， 告 条 件 为 真 则 调用 fun; 者 条 件 为 假 
则 跳 过 fbn。 在 结构 图 中 这 种 情况 用 一 个 菱形 代表 ， 并 把 它 放 置 在 两 个 模块 间 的 同一 垂直 线 上 。 

图 D-3b 代表 在 两 个 模块 中 进行 选择 。 在 这 个 例子 中 ， 模 块 select 从 A 和 B 中 进行 选 
择 。 每 执行 一 次 select 有 且 仅 有 两 者 中 的 一 个 被 调用 。 这 就 是 我 们 所 熟知 的 异 或 : 两 个 待 选 
过 程 中 的 一 个 被 执行 而 另 一 个 不 执行 。 异 或 用 两 个 模块 之 间 的 “+” 号 表示 。 

现在 考虑 设计 从 多 个 模块 中 选择 调用 一 个 模块 。 这 发 生 在 根据 几 个 不 同 的 选择 条 件 调 用 
不 同 模块 的 情况 。 图 D-4 包含 了 一 个 选择 语句 ， 它 根据 不 同 的 颜色 调用 不 同 的 模块 。 





a ) 条 件 b ) 异 或 
图 D-3 ”结构 图 中 的 选择 图 D-4 选择 的 一 个 例子 


388 有 振 有 DD 


D.1.3 结构 图 中 的 循环 

让 我 们 来 看 一 下 循环 是 如 何在 一 个 结构 图 中 表示 的 。 符 号 非常 简单 。 循 环 就 是 转圈 ， 因 
此 它 所 用 的 符号 是 圆圈 。 程 序 员 使 用 两 种 基本 的 循环 符号 ， 第 一 种 是 简单 循环 ， 如 图 D-5a 
所 示 。 另 一 种 是 条 件 循环 ， 如 图 D-5b 所 示 。 当 模块 被 无 条 件 调用 时 ， 如 在 while 循环 中 ， 
只 需 在 被 调用 函数 的 上 方 用 圆圈 住 直线 。 另 一 方面 ， 如 果 调 用 是 有 条 件 的 ， 如 在 if-else 语句 
循环 中 ， 则 在 圆 内 还 要 有 一 个 代表 条 件 的 萎 形 画 在 直线 上 。 

图 D-6 显示 模块 process 的 基本 结构 。 圆 位 于 控制 循环 模块 的 下 面 。 在 这 个 例子 中 ， 循 
环 语句 被 包含 在 process 中 ， 并 且 它 调用 三 个 模块 A、B 和 C。 循 环 的 本 质 不 能 够 从 结构 图 
中 限定 ， 它 可 以 是 三 个 基本 循环 结构 中 的 任意 一 个 。 





图 D-5 结构 图 中 的 循环 


D.2 阅读 结构 图 

结构 图 一 般 都 是 从 上 到 下 ， 从 左 到 右 阅 读 的。 图 D-2 中 曾 提 过 ， 这 种 规则 说 明了 程序 
(main) 包含 三 个 子 模块 : initialize、process 和 endOfJob。 按 照 从 左 到 右 的 规则 ， 首 先 被 程序 
调用 的 为 initialize (初始 化 )。 初 始 化 完成 后 ， 调 用 process( 通 数 过 程 )。 当 函数 的 处 理 过 程 结 
束 后 ， 函 数 调用 endOfJob ( 收 旦 工作 )。 换 句 话 说 ， 某 些 结构 图 显示 的 函数 是 从 左 到 右 调用 的 。 

从 上 到 下 的 概念 可 以 通过 process 来 说 明 。 当 process 被 调用 时 ， 它 轮流 调用 A、B 、C， 
当 A 模块 结束 时 ，B 模块 还 没 开始 运行 。A 模块 在 运行 时 ， 它 将 轮流 调用 Al 和 A2。 换 言 
之 ,在 B 模块 被 调用 前 ， 在 A2 前 面 的 模块 都 已 经 被 调用 过 了 。 

通常 ， 程 序 要 完成 一 个 功能 都 要 调用 多 个 公有 模块 。 这 些 调用 在 程序 中 是 分 散 的 。 不 管 
这 些 调 用 在 程序 中 的 逻辑 地 址 ， 在 结构 图 中 都 将 显示 这 些 调用 。 为 了 确认 公有 的 结构 ， 和 矩形 
块 的 有 下 角 将 包括 双向 影 线 或 画 一 块 阴影 。 假 如 公有 模块 很 复杂 且 包 括 子 模 块 ， 这 些 子 模块 
只 能 被 显示 一 次 。 如 果 要 表示 某 参 数 还 没完 成 ， 还 需要 增加 结构 ， 那 么 一 般 都 在 该 矩形 下 面 
加 上 “一 ”符号 。 这 个 概念 如 图 D-7 所 示 ， 如 在 该 程序 的 不 同 地 方 都 用 到 了 一 个 公有 模块 
average。 注 意 ， 你 不 可 能 图 形 化 显示 一 个 与 两 个 子 模块 相连 的 模块 。 





2 wh 


图 D-7 同一 模块 的 一 些 调用 
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D.3 结构 图 规则 


我 们 在 本 章 中 总 结 了 几 个 规则 
。 结 构图 中 的 每 个 矩形 都 代表 了 一 个 模块 。 

。 矩 形 中 的 名 字 就 是 模块 代码 中 的 模块 名 。 

。 结 构图 中 只 包含 模块 流程 ， 没 有 任何 代码 。 

。 通 用 模块 的 矩形 一 般 都 在 右 下 角 画 一 条 双向 影 线 或 一 块 阴影 。 

。 数 据 流 和 流标 志 是 可 选 的 ， 但 如 果 使 用 ， 则 必须 命名 。 

。 输 入 流 和 流标 志 显 示 在 垂直 线 的 左 端 ， 输 出 流 和 标志 显示 在 其 右 端 
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布尔 代数 和 逮 辑 电路 


E.1 布尔 代数 

布尔 代数 处 理 只 有 0 或 1 两 种 值 的 变量 和 常量 。 这 种 代数 适合 表示 计算 机 中 的 信息 ， 该 
计算 机 是 由 只 有 开 和 关 两 种 状态 的 信号 集合 而 成 的 。 
E.1.1 ” 常量、 变量 和 运算 符 

在 布尔 代数 中 我 们 使 用 常量 、 变 量 和 运算 符 。 


1. 常量 

只 有 两 个 常量 1 和 0，1 相当 于 逻辑 真 ; 0 相当 于 逻辑 假 。 

2. 变量 

使 用 字母 (如 x、y 和 z) 代表 变量 ,布尔 变量 只 能 取 值 0 或 1。 
3. 运算 符 


我 们 使 用 三 个 基本 的 运算 符 : NOT、AND 和 OR。 使 用 单 引 号 表示 NOT， 使 用 一 小 点 
表示 AND， 使 用 “+” 号 表示 OR， 如 下 所 示 : 

XS NOTP 区 Xxy— XxX ANDy yORYy 

运算 符 带 一 个 或 两 个 值 ， 产 生 一 个 输出 值 。 第 一 个 运算 符 NOT 是 一 个 一 元 运算 符 ， 只 
带 一 个 值 ; 另外 两 个 (AND 和 OR) 是 二 元 运算 符 ， 带 两 个 值 。 注 意 : 运算 符 的 选择 是 任意 
的 ， 我 们 可 以 通过 NAND (后 面 解释 ) 构建 所 有 的 门 电路 。 


E.1.2 表达 式 
一 个 表达 式 是 布尔 运算 符 、 常 量 和 变量 的 组 合 。 下 面 是 布尔 表达 式 : 


0 Xx > x+0 
X 十 1 十 》) xX. (y+2z) X+y+2 Xsigl 


E.1.3 ”逻辑 门 


逻辑 门 是 一 种 电子 设备 ， 它 通常 有 1~ 和 N 个 输入， 产生 一 个 输出 。 但 是 ， 在 本 附录 中 ， 
为 简化 起 见 ， 我 们 使 用 只 带 一 个 或 两 个 输入 的 门 。 输 出 的 逻辑 值 由 表示 门 的 表达 式 和 输入 值 
决定 。 各 种 各 样 的 逻辑 门 被 广泛 地 应 用 于 数字 计算 机 中 。 图 E-1 显示 了 8 种 最 常见 的 门 的 符 
号 、 真 值 表 ( 见 第 4 章 ) 和 表达 式 ， 该 表达 式 在 给 定 输入 时 ， 能 给 出 输出 。 
。 缓冲 器 ”第 一 个 门 仅仅 是 一 个 缓冲 器 ， 其 中 输入 和 输出 是 相同 的 。 如 果 输 入 是 0， 输 
出 也 是 0; 如 果 输 入 是 1， 输 出 也 是 1。 缓 冲 器 只 是 放大 了 输入 信号 。 
。NOT NOT 门 是 NOT 运 算 符 的 实现 。 这 个 门 的 输出 是 输入 的 相反 值 。 如 果 输 入 是 
1， 输 出 就 是 0;， 如果 输入 是 0， 输 出 就 是 1。 
。AND AND 门 是 AND 运算 符 的 实现 。 它 带 两 个 输入 ， 产 生 一 个 输出 。 如 果 两 个 输 
人 都 是 1 时 ， 输 出 才 是 1; 否则 ， 输 出 就 是 0。 有 时 AND 运算 符 称 为 乘积 。 
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图 E-1 常用 门 的 符号 和 真 值 表 


。OR OR 门 是 OR 运算 符 的 实现 。 它 带 两 个 输入 ， 产生 一 个 输出 。 如 果 任 一 个 输入 或 
两 个 输入 为 1， 输 出 就 是 1， 否 则 ， 输 出 就 是 0。 有 了 时 OR 门 称 为 加 。 
NAND NAND 门 是 一 个 AND 门 跟 一 个 NOT 门 的 逻辑 组 合 。 当 我 们 讨论 这 些 门 的 
实际 实现 时 ， 我 们 将 给 出 这 个 门 存在 的 原因 。 当 两 个 门 的 输入 相同 时 ，NAND 门 的 
输出 与 相应 AND 门 相反 。 
NOR NOR 门 是 一 个 OR 门 跟 一 个 NOT 门 的 逻辑 组 合 。 当 我 们 讨论 这 些 门 的 实际 实 
现时 ， 我 们 将 给 出 这 个 门 存 在 的 原因 。 当 两 个 门 的 输入 相同 时 ，NOR 门 的 输出 与 相 
应 OR 门 相反 。 
XOR XOR ( 异 或 ) 门 由 表达 式 (x .y+4x'* y) 定义 ， 它 通常 表示 成 (x 中 y)。 当 两 
个 输入 不 同时 ， 输 出 为 1 ; 输入 相同 时 ， 输 出 为 0。 也 可 以 说 这 是 一 个 更 多 限制 的 
OR 门 。 除 了 两 个 输入 为 1， 输 出 为 0 的 情况 ，XOR 门 的 输出 与 OR 门 相同 。 

。XNOR XNOR 门 由 表达 式 (zx y 咎 x'* y) ' 定 义 ， 它 通常 被 表示 成 (zx 由 J 臣 '。 它 与 

XOR 门 相 反 。 当 两 个 输入 相同 时 ， 输 出 为 1 ; 输入 不 同时 ， 输 出 为 0。 也 可 以 说 这 表 
示 了 逻辑 意义 上 的 等 价 ; 只 有 两 个 输入 相等 时 ， 输 出 才 为 1。 

门 的 实现 

前 一 节 中 讨论 的 逻辑 门 在 物理 上 都 可 以 用 电子 开关 (晶体管 ) 来 实现 。 最 通常 的 实现 指 
使 用 三 个 门 : NOT、NAND 和 NOR。NAND 门 比 AND 门 使 用 更 少 的 部 件 。 这 对 NOR 门 
和 OR 门 也 是 同样 的 。 所 以 ，NAND 门 和 NOR 门 成 了 工业 中 的 通用 标准 。 我 们 这 里 只 讨论 
这 三 个 门 的 实现 。 虽 然 在 这 里 要 简单 提 一 下 开关 ,但 开关 在 实际 应 用 过 程 中 是 被 晶体 管 替代 
的 。 门 电路 中 使 用 的 晶体 管 行为 就 像 一 个 开关 。 当 给 开关 施 以 合适 的 输入 电压 时 ， 开 关 可 以 
打开 或 关闭 。 有 多 种 技术 来 实现 这 些 晶 体 管 。 但 是 我 们 把 实现 晶体管 的 讨论 留 给 电子 方面 的 
书籍 。 
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NOT 门 的 实现 
NOT 门 可 以 用 电子 开关 、 电 压 源 和 电阻 器 来 实现 ， 如 图 E-2 所 示 。 
正 电 压 
(y 伏 ) 
= b ) 符号 
x'( 输 出 ) NOT 
x (输入 ) 开关 pe 





三 地 (0 电压 ) c) 表 
a ) 实现 


图 E-2 NOT 门 的 实现 


门 的 输入 是 一 个 掌控 开关 打开 和 关闭 的 控制 信和 号。 一 个 为 0 的 输入 信号 使 开关 打开 ， 而 
为 1 的 输入 信号 使 开关 关闭 。 输 出 是 开关 前 的 一 点 上 的 电压 (输出 接线 端 )。 如 果 这 点 电压 
值 是 正 的 (V 伏 )， 输 出 就 被 解释 成 1 ; 如 果 电 压 是 0 (或 低 于 一 个 阅 值 )， 输 出 就 被 解释 成 
0。 当 开关 是 打开 的 ， 没 有 电流 通过 电阻 器 ， 因 此 没有 电压 的 下 降 ， 输 出 电压 就 是 玉 ( 解 释 
成 1 )。 合 上 开关 ， 输 出 接线 端 就 与 地 相连 ， 电 压 就 为 0 (或 几乎 为 0 )， 这 就 被 解释 为 逻辑 0。 


注意 : ee 
RT 


NAND 门 的 次 现 
NAND 门 可 以 用 串联 的 两 个 开关 (两 个 输入 ) 来 实现 。 为 了 使 得 电流 能 通过 电路 从 正极 流 


向 地 ， 两 个 开关 都 必须 合 上 〔 即 两 个 输入 必须 是 1 )， 在 这 种 情况 下 ， 因 为 输出 接线 端 与 地 (逻辑 
0) 相连 ， 所 以 输出 接线 端的 电压 是 0。 如 果 一 个 开关 或 两 个 开关 是 打开 的 ( 即 输入 是 00、01 或 
10 )， 没 有 电流 通过 电阻 器 ， 通 过 电阻 器 的 电压 没有 下 降 ， 输 出 接线 端的 电压 就 是 矿 ( 逻 辑 1 )。 

图 E-3 显示 了 NAND 门 的 实现 ， 电 路 的 表现 与 表 中 显示 的 值 匹 配 。 注 意 : 如 果 需 要 一 
个 AND 站 de NAND 门 跟 一 个 NOT 门 来 实现 。 


a Sa - 个 电子 开关 。 Ri 
2 汪 
9 a i Cs i 1 da i 













x (输入 ) 





y (输入 ) 





三 地 (0 电压 ) 
a ) 实现 
图 E-3 NAND 门 的 实现 
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NOR 门 的 实现 

NOR 门 可 以 用 并 联 (两 个 输入 ) 的 两 个 开关 来 实现 ， 如 果 两 个 开关 都 打开 ， 那 么 电流 就 
不 流 过 电阻 器， 在 这 种 情况 下 ， 通 过 电阻 器 的 电压 没有 下 降 ， 这 就 意味 着 输出 接线 端 持 有 电 
压 上 (还 辑 1 )。 如 果 有 一 个 开关 或 两 个 开关 合 上 了 ， 输 出 接线 端 就 与 地 相连 ， 输 出 电压 为 0 


(逻辑 0 )。 
图 E-4 显示 了 NOR 门 的 实现 ， 电 路 的 表现 与 表 中 显示 的 值 匹 配 。 注 意 ， 如 果 需 要 一 个 


OR 门 ， 可 以 通过 一 个 NOR 门 和 一 个 NOT 门 来 实现 。 
正 电 压 (yV 优 ) 


开关 (输入 ) 


三 地 (0 电压 ) 
a ) 实现 


E-4 NOR 门 的 实现 





电阻 器 


x( 输 入 ) 





要 实现 一 个 NOR 门 5 -需要 并 联 在 一 起 的 两 外 电子 开关 让 下 让 生息 全 站 上 寺 


E.1.4 公理、 定理 和 恒等式 
为 了 研究 布尔 代数 ， 我 们 需要 一 些 规则 。 在 布尔 代数 中 这 些 规则 可 以 分 成 三 大 类 ; 公 
理 、 定 理 和 恒等式 。 
1. 公理 
布尔 代数 像 其 他 代数 一 样 使 用 一 些 规则 ， 称 为 公理 ， 它 们 不 需要 证 明 。 表 E-1 显示 了 布 
尔 代 数 中 的 公理 。 
表 E-1 布尔 代数 的 公理 


1 X=0—x'=1 
| 
2. 定理 


定理 是 我 们 用 公理 证 明 的 规则 ， 虽 然 我 们 必须 把 这 些 证 明 留 给 专门 介绍 布尔 代数 的 书 。 
表 E-2 显示 了 布尔 代数 中 的 部 分 定理 。 


表 E-2 布尔 代数 的 基本 定理 


与 OR 和 
mr 
3. 恒等式 


使 用 公理 和 定理 ， 我 们 可 以 推导 出 许多 人 恒等式。 在 表 E-3 中 ,我 们 只 列 出 了 最 常用 的 ， 
把 这 些 证 明 留 给 专门 介绍 布尔 代数 的 书 。 
表 E-3 与 OR 和 AND 运算 符 相 关 的 基本 的 恒等式 


一 症 Se 
rr 
ERZTEZZ 
ER 
Tr 


德 ， 摩根 律 在 逻辑 设计 中 起 到 非常 重要 的 作用 ， 正 像 我 们 马上 要 看 到 的 一 样 。 它 们 可 以 
推广 到 多 个 变量 ， 例 如， 对 于 三 个 变量 有 如 下 的 两 个 恒等式 ， 


(xty+2)' =x’ *y 2 (X72 =x yy AZ 


E.1.5 布尔 函数 

我 们 把 布尔 函数 定义 为 一 个 具有 nn 个 布尔 输入 变量 和 一 个 布尔 输出 变量 的 函数 ， 如 
图 E-5 所 示 。 

盟 数 可 以 用 真 值 表 来 表示 ， 也 可 以 用 表达 式 
nl 
面 n 列 定义 了 变量 的 可 能 的 值 ， 最 后 一 列 定 义 了 
函数 的 输出 值 ， 它 是 前 面 n 列 值 的 组 合 。 

图 E-6 显示 了 i 和 丈 两 个 函数 的 真 值 表 和 
表达 式 表 示 。 虽 然 真 值 表 是 唯一 的 ， 但 函数 可 以 用 不 同 的 表达 式 表 示 。 我 们 为 每 个 函数 显示 
了 两 个 表达 式 。 注 意 : 第 二 个 表达 式 要 简短 些 。 后 面 将 介绍 为 了 提高 实现 的 效率 ， 需 要 简化 
表达 式 。 

真 值 表 到 表达 式 的 转换 

函数 的 说 明 一 般 是 给 一 个 真 值 表 (参见 第 4 章 )。 为 了 用 逻辑 门 (前 面 刚 介绍 过 ) 实现 函 
数 ， 我 们 需要 找到 真 值 表 对 应 的 表达 式 。 有 两 种 方法 可 以 采用 。 

积 之 和 

第 一 种 把 真 值 表 转化 成 表达 式 的 方法 称 为 积 之 和 。 一 个 函数 的 积 之 和 表示 是 由 多 达 2" 
个 项 组 成 ， 其 中 每 个 项 称 为 最 小 项 。 最 小 项 是 函数 中 所 有 变量 的 乘积 (AND 运算 )， 其 中 每 





图 E-5 布尔 函数 
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个 变量 只 出 现 一 次 。 例 如 ， 在 三 个 变量 的 函数 中 ， 有 8 个 最 小 项 ， 如 x .yz 或 x*y，z'。 
每 一 项 代表 真 值 表 中 的 一 行 。 如 果 变 量 的 值 是 0， 变量 的 补 就 出 现在 项 中 ; 如 果 变 量 的 值 是 
1， 变 量 本 身 就 出 现在 项 中 。 为 了 把 真 值 表 转 换 成 积 之 和 表示 ， 我 们 使 用 如 下 策略 : 


FI=xXx .y+xX. y+X.y -i og 
Fi=X+y' =X .2Z+X .2 


= 


By 


J》 
0 
0 
1 
1 
0 
0 
1 
1 
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FF 的 真 值 表 
图 E-6 真 值 表 到 表达 式 转化 的 例子 


1 ) 找 出 函数 值 为 1 的 行 对 应 的 最 小 项 ; 
2 ) 对 第 1 ) 步 中 的 项 求 和 (OR 运算 )。 
和 之 积 
第 二 种 把 真 值 表 转 化 成 表达 式 的 方法 称 为 和 之 积 。 一 个 函数 的 和 之 积 表示 是 由 多 达 2 
个 项 组 成 ， 其 中 每 个 项 称 为 最 大 项 。 最 大 项 是 函数 中 所 有 变量 的 和 ( OR 运算 )， 其 中 每 个 变 
量 只 出 现 一 次 。 例 如 ， 在 三 个 变量 的 函数 中 ， 有 8 个 最 大 项 ， 如 x'+y'+z' 或 xty'+z'。 为 了 把 
真 值 表 转 换 成 和 之 积 表示 ， 我 们 使 用 如 下 策略 : 
1 ) 找 出 函数 值 为 0 的 行 对 应 的 最 小 项 ; 
2 ) 对 第 1 步 中 的 项 求 和 ， 并 求 补 ; 
3 ) 使 用 德 ， 摩根 律 ， 把 最 小 项 改 成 最 大 项 。 
图 E-7 显示 了 如 何 建立 图 E-6 中 的 函数 Fi 和 F; 的 积 之 和 与 和 之 积 。 
积 之 和 直接 由 真 值 表 而 得 ,但 和 之 积 需 要 使 用 德 * 摩根 律 。 注 意 : 有 时 是 第 一 种 方法 给 
出 较 短 的 表达 式 ， 有 时 是 第 二 种 方法 给 出 较 短 的 表达 式 。 
积 之 和 
F=x .y+x. y+x*y 
和 之 积 


F\=(x' 用 =(x+y) 


积 之 和 
F=x ,yy :2HX YHX YY ZX YZ 
和 之 积 


F=' yr:2+X YZ2+X YY ZX 2) 
人 





= 人 + 二 到 ， Cty +2) * (Cty+2) * +y+2) 





0 
0 
0 
0 
1 
1 
1 
1 


2 . 和 


EER 





,可 
全 


图 E-7 例 E-l 
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E.1.6 项 数 简化 

虽然 我 们 可 以 使 用 前 面 介绍 过 的 逻辑 门 来 实现 布尔 函数 ， 但 通常 效率 低下 。 卫 数 的 直接 
实现 需要 更 多 的 门 。 如 果 化 简 ， 门 的 数目 就 可 以 减少 。 通 常 有 两 种 简化 方法 : 用 卡 诺 图 的 代 
数 方法 和 Quine-McKluskey 方法 。 


1. 代数 方法 
我 们 可 以 使 用 前 面 讨论 过 的 公理 、 定 理 和 恒等式 来 化 简 函 数 。 例 如 ， 可 以 化 简 图 E-7 中 


的 第 一 个 函数 (本 )， 如 下 所 示 : 


.eh es Wd fie .es 


“tt 关于 AND 的 恒等式 3 (分 配 律 ) 
= 和 二 计生 尖 汪 关于 OR 的 定理 5 

区 关于 AND 的 定理 3 

= 和 关于 AND 的 定理 1 (交换 律 ) 
= 二 六 恒等式 5 (吸收 律 ) 

i 关于 OR 的 定理 1 (交换 律 ) 


这 就 意味 着 未 化 简 的 表达 式 需 要 8 个 门 ， 而 化 简 过 的 只 需要 两 门 : 一 个 NOT 和 一 


个 OR。 / 


2. 卡 诸 图 方法 
另外 一 个 化 简 的 方法 涉及 卡 诺 图 的 使 用 。 这 种 方法 通常 是 被 4 个 以 上 变量 的 函数 使 用 


的 。 图 是 一 个 具有 2" 个 单元 格 的 矩阵， 每 个 单元 格 代表 函数 的 一 个 值 。 要 关注 的 第 一 点 是 
正确 地 填写 图 。 与 通常 的 一 行 接 一 行 或 一 列 接 一 列 地 填写 方法 不 同 ， 它 是 根据 图 中 显示 的 变 
量 的 值 来 填写 的 。 图 E-8 显示 了 一 个 n=2，3 或 4 的 例子 。 








“Dy b 
0 0 0 
0 0 1 
0 1 0 
0 11 
1 0 0 
1 0 1 
人 少 
a Wg 1 11 
0 0 0 0 0 
0 0 1 
1 0 十 0 
和 Ee 
0 0 1 00 
De 9 5 
1 0 省 
站 性 
请 的 真 值 表 及 的 真 值 表 
图 E-8 卡 诺 图 的 建造 


在 真 值 表 中 ， 我 们 从 真 值 表 的 顶部 到 底部 去 使 用 函数 的 值 。 图 是 一 行 接 一 行 地 被 填写 
的 ， 但 行 的 顺序 是 1, 2, 4, 3。 在 每 一 列 中 ， 列 也 是 一 个 接 一 个 被 填写 的 ， 但 列 的 顺序 是 1， 
2，4，3。 第 4 行 在 第 3 行 的 前 面 ， 第 4 列 在 第 3 列 的 前 面 。 这 样 的 安排 是 最 大 程度 地 化 简 


的 需要 。 


布 泵 代 改 和 过 帮 由 避 397 





积 之 和 

化 简 可 以 通过 建立 积 之 和 来 进行 ， 当 采用 这 种 方法 化 简 函 数 时 ， 使 用 值 为 1 的 最 小 项 。 
为 了 得 到 高 效 的 表达 式 ， 首 先 合并 相 邻 的 最 小 项 。 注 意 : 相 邻 也 包含 位 的 环绕 。 
图 E-9 显示 了 我 们 的 第 一 个 
函数 使 用 积 之 和 的 化 简 。 第 二 行 中 的 1 包 
含 了 整个 x 的 域 。 第 一 列 中 的 1 包含 了 整 HH 一 一 ea [ 儒 一 
个 y 的 域 。 得 出 的 化 简 函 数 是 Fi=(x)+0Y)。 局 的 卡 湛 图 
图 中 还 显示 了 用 一 个 OR 门 和 一 个 NOT 门 FC)+0) 
的 实现 。 ;— p>. — ro 

3K 浊 图 E-10 显示 了 第 二 个 函数 使 
用 积 之 和 的 化 简 。 第 二 行 的 1 是 x 域 和 z 
域 的 交集 ， 它 用 (x ' z) 来 表示 。 第 一 行 的 1 是 x 和 z 域 的 交集 ， 它 用 (x'*…z') 来 表示 。 得 
出 的 化 简 函 数 是 =(x* z)+(x'* z”))。 图 中 还 显示 了 使 用 一 个 OR 门 、 两 个 AND 门 和 两 个 
NOT 门 的 实现 。 








ZzZ 
严 的 卡 诺 图 F(x * z)+(x' + 2) 


> 4 


E-10 例 E-3 


和 之 积 
化 简 可 以 通过 使 用 和 之 积 的 方法 来 进行 ， 当 采用 这 种 方法 化 简 函 数 时 ， 使 用 最 大 项 。 为 


了 得 到 高 效 的 表达 式 ， 首 先 合并 相 邻 的 最 小 项 。 但 是 ， 用 这 种 方法 得 到 的 函数 是 我 们 要 找 的 
盟 数 的 相反 值 ， 我 们 需要 用 德 ， 摩根 律 找 到 函数 。 

图 E-11 显示 了 第 一 个 函数 使 用 和 之 积 的 化 简 。 注 意 : 在 此 情况 下 ， 实 现 与 图 
E-9 中 的 相同 ， 但 不 经 常 是 这 样 的 。 还 要 注 
意 : 函数 只 有 一 个 项 ， 不 需要 AND 门 。 

E-12 显示 了 第 二 个 函数 使 
用 和 之 积 的 化 简 。 注 意 ; 过 程 给 出 (F,)'， 所 
以 我 们 需要 使 用 德 . 摩根 律 找到 F,。 图 中 还 
显示 了 使 用 两 个 NOT 门 、 两 个 OR 门 和 一 (F,)=(F,)=(x » y)'=(x + )) 

个 AND 门 的 实现 。 这 个 实现 比 我 们 使 用 最 一 F.=(x+y) 
小 项 得 到 的 那个 效率 要 低 。 我 们 总 是 采用 高 。 ” 


效 的 实现 。 E-11 例 E-4 


CC ')») 








多 
五 的 卡 诺 图 (FE,)=(x’ . 2)+(x » 2") 


F,=[(F)Y =[( a+r z= 下， 人. 2)'=e+2) + ta) 


Xx 
F=(x+2") » (x'+z) 
4 


图 E-12 例 E-5 


E.2 逻辑 电路 
计算 机 通常 是 由 称 为 逻辑 电路 的 标准 构件 建造 而 成 的 。 逻 辑 电路 分 成 两 大 类 : 组 合 电路 
和 时 序 电 路 。 我 们 将 简单 地 讨论 每 一 类 ， 并 给 出 一 些 例子 。 


E.2.1 组 合 电路 

组 合 电路 是 由 带 有 nn 个 输入 和 m 个 输出 的 钦 辑 门 组 成 的 电路 。 任 何 时 刻 每 个 输出 完全 
依赖 于 所 有 给 定 的 输入 。 

在 组 合 电路 中 ， 任何 时 刻 每 个 输出 完全 依赖 于 所 有 给 定 的 输入 。 


图 E-13 显示 了 具有 nn 个 输入 和 m 个 输出 的 组 合 电 路 的 块 图 。 ppg 我 
们 可 以 说 一 个 带 有 m 个 输出 的 组 合 电 路 可 以 看 成 m 个 函数 ， 每 个 输出 对 应 一 个 函数 。 
组 合 电路 的 输出 通常 是 由 真 值 表 来 定义 的 ， 只 是 真 值 表 需要 有 m 个 输出 。 


1. 半 加 法 器 

一 个 简单 的 组 合 电路 的 例子 是 半 加 法 器 ， 这 个 加 法 器 只 能 做 两 个 二 进 制 位 的 加 法 。 半 加 
法 硬是 具有 两 个 输入 和 两 个 输出 的 组 合 电路 。 两 个 输入 定义 了 要 进行 加 法 的 两 个 二 进 制 位 ， 
第 一 个 输出 是 两 个 二 进 制 位 的 和 ， 而 第 二 个 输出 是 要 传 给 下 一 个 加 法 器 的 进位 。 图 E-14 显 
示 了 一 个 半 加 法 器 ， 并 显示 了 它 的 真 值 表 和 生成 电路 所 用 的 逻辑 门 。 





图 E-13 一 个 组 合 电 路 图 E-14 半 加 法 器 


两 个 二 进 制 位 的 和 可 以 使 用 XOR 门 得 到 ， 进 位 可 以 使 用 AND 门 得 到 。 

2. 多 路 复 用 器 

多 路 复 用 器 是 一 个 带 有 站 个 输入 和 只 有 一 个 输出 的 组 合 电路 。z 个 输入 由 数据 输入 DD 和 
控制 输入 C 组 成 (n=D+C)。 在 任何 时 刻 ， 多 路 复 用 器 只 选择 数据 输入 DD 中 的 一 个 发 送 到 唯 
一 的 数据 输出 ， 而 这 个 选择 是 由 控制 位 的 值 来 决定 的 。 为 了 选择 数据 输入 DD 中 的 一 个 ， 需 
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要 C=]og2D 的 控制 位 。 如 果 D=2， 在 任何 时 刻 只 有 一 个 数据 输入 发 送 到 输出 ， 控 制 输入 只 
是 一 位 。 如 果 控 制 输入 为 0， 则 第 一 个 数据 输入 直接 到 输出 ; 如 果 控 制 输入 为 1， 则 第 二 个 
数据 输入 被 发 送 到 输出 。 

图 E-15 显示 了 真 值 表 和 2X1 多 路 复 用 器 的 电路 。 注 意 : 电路 实际 上 有 三 个 输入 和 一 个 
输出 ， 控 制 输入 被 看 成 是 一 个 输入 。 注 意 : 这 里 的 真 值 表 非 常 简化 ， 输 出 依 赖 于 控制 输入 ， 
但 输出 的 值 却 是 两 个 输入 中 的 一 个 。 


C D,: 第 一 个 输入 C: 控制 位 
， D,: 第 二 个 输入 0: 输出 





a) 组 合 电 路 
图 E-15 多 路 复 用 器 


E.2.2 时序 电路 


组 合 电路 是 没有 记忆 的 ， 它 不 能 记 住 它 以 前 的 输出 ， 在 任何 时 刻 输出 仅仅 依赖 于 当前 
的 输入 。 而 时 序 电 路 包含 了 逻辑 上 的 记忆 概念 ， 记 忆 使 得 电路 能 记 住 当前 状态 ， 以 便 将 来 使 
用 ,将 来 的 状态 可 以 依赖 于 当前 状态 。 


1. 双 稳 态 多 谐振 荡 器 
为 了 把 记忆 的 想法 添加 到 组 合 电路 中 ， 发 明了 称 为 双 稳 态 多 谐振 荡 器 的 存储 单元 ， 该 存 


储 单元 能 保存 一 位 信息 。 一 组 双 稳 态 多 谐振 荡 器 可 以 用 来 保存 一 组 二 进 制 位 。 

SR 双 稳 态 多 谐振 水 器 

最 简单 的 双 稳 态 多 谐振 荡 是 SR 双 稳 访 多 谐振 荡 器 ， 其 中 有 两 个 输入 S (设置 ) 和 及 ( 重 
置 ) 以 及 两 个 输出 Q 和 Q'， 它 们 总 是 互相 相反 的 。 图 E-16 显示 了 一 个 SR 双 稳 态 多 谐振 荡 
的 符号 、 电 路 和 特征 表 。 注 意 : 特征 表 和 我 们 在 组 合 电 路 中 的 真 值 表 是 不 同 的 。 特 征 表 显 示 
了 下 一 个 输出 Q(t+1)， 输 出 Q(t+1) 是 基于 当前 输出 Q(1) 和 输入 的 。 





b ) 电路 
图 E-16 SR 双 稳 态 多 谐振 荡 器 


特征 表 显 示 出 : 如 果 S$ 和 及 都 为 0， 输 出 QG+H=Q(GD， 也 就 是 下 一 个 输出 和 当前 输出 
相同 ; 如 果 S 为 0，R 为 1， 输出 Q(t+1)=0， 这 意味 着 输出 将 被 重 置 (R=1 ); 如 果 S 为 1，R 
为 0， 输出 Q(t+1)=1， 这 意味 着 输出 将 被 设置 。 但 是 ， 如 果 S 和 有 都 为 1， 下 一 个 输出 是 不 
可 预测 的 (无 定义 )。 注 意 : 在 特征 表 中 我 们 并 没有 显示 Q' 的 值 ， 因 为 它 总 是 与 Q 值 相反 的 。 

一 个 SR 双 稳 态 多 谐振 荡 器 可 以 被 用 作 设 置 - 重 设 设备 。 例 如 ， 如 果 输 出 是 连 到 一 个 电 
气 音响 器 上 的 ， 警 报 可 以 通过 让 R=0 和 S=1 来 设置 ,设置 后 ， 警 报 会 一 直 响 ， 直 到 它 被 用 
R=1 和 S=0 来 重 置 。 这 个 设计 的 唯一 缺陷 是 RR 和 S 不 应 该 同时 为 1。 
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为 了 理解 SR 双 稳 态 多 谐振 荡 器 的 原理 ， 需 要 创建 它 的 真 值 表 。 但 需要 注意 , 我 人 有 3 个 


输入 和 1 个 输出 (Q 和 Q' 是 独立 的 )。 表 E-4 
表 E-4 SR 双 稳 态 多 谐振 荡 器 的 真 值 表 


是 该 振荡 器 的 真 值 表 。 
D 双 稳 态 多 谐振 荡 器 s | R | ao | Qt+1) 
SR 双 稳 态 多 谐振 荡 回 不 能 当 作 1 位 存 0。 | 0 | 0。 | 。 
储 器 来 使 用 ， 因 为 它 需 要 两 个 输入 , 而 丰 是 0 | 0 | 1 | ， 
一 个 。 对 SR 双 稳 态 多 谐振 荡 器 的 一 个 小 的 0 | 2 1 0 
修改 就 能 建立 一 个 D 双 稳 态 多 谐振 水 器 (D 上 0 
代表 数据 )。 图 E-17 显示 一 个 DD 双 稳 态 多 | 一 一 一 一 | 
谐振 荡 器 的 符号 和 特征 。 : i ” 
注意 ; 虽然 D 双 稳 态 多 谐振 荡 器 的 输 | rp 
与 它 司 ， 但 是 输出 是 一 直 保 持 
出 与 它 的 输入 相同 ， 人 | 人 


的 ， 直 到 给 出 新 的 输入 。 这 意味 着 它 能 记忆 
它 的 输入 状态 。 





图 E-17 D 双 稳 态 多 谐振 荡 器 


JK 双 稳 态 多 谐振 荡 嚣 

为 了 把 未 定义 状态 从 SR 双 稳 态 多 谐振 荡 器 中 移 去 ，JK 双 稳 态 多 谐振 荡 器 就 被 发 明了 
( JK 代表 Jack Kilby， 他 发 明了 集成 电路 )。 增 加 两 个 AND 门 到 SR 双 稳 态 多 谐振 荡 器 中 就 
形成 了 JK 双 稳 态 多 谐振 荡 器 ， 它 没有 未 定义 的 状态 。 图 E-18 显示 了 J 双 稳 态 多 谐振 荡 侣 


和 它 的 特征 表 。 





E-18 ”JK 双 稳 态 多 谐振 荡 响 


T 双 稳 态 多 谐振 水 器 

另外 一 个 通用 的 双 稳 态 多 谐振 荡 器 是 T 双 稳 态 多 谐振 荡 器 (T 代表 拨 动 开关 〈toggle))， 
这 种 双 稳 态 多 谐振 葛 器 通过 把 区 双 稳 态 多 谐振 荡 器 的 两 个 输入 合 在 一 起 ( 称 为 T 输 入 ) 而 
制 成 。 这 个 输入 拨 动 双 稳 态 多 谐振 葛 器 的 状态 : 如 果 输 入 为 0， 下 一 个 状态 跟 当前 状态 相同 ; 
如 果 输 入 为 1， 下 一 个 状态 与 当前 状态 相反 。 图 E-19 显示 了 T 双 稳 态 多 谐振 荡 器 的 符号 、 


电路 和 特征 表 。 


硕 灰 代 必 和 二 确 中 粘 401 





_T 1TQcC+D: 


-| 
中 





a ) 符号 b ) 电路 
图 E-19 T 双 稳 态 多 谐振 荡 器 


2. 同步 与 异步 

到 目前 为 止 ， 我 们 讨论 的 双 稳 态 多 谐振 荡 器 都 被 称 为 异步 设备 : 一 个 状态 到 另 一 个 状态 
的 转换 只 有 当 输 入 改变 之 后 才 会 发 生 。 数 字 计 算 机 却 是 同步 设备 ， 计 算 机 中 的 中 央 时 钟 控制 
了 所 有 逻辑 电路 的 调度 。 时 钟 建 立 了 一 个 信号 (具有 相等 脉 宽 的 一 系列 脉冲 ) 来 调整 所 有 的 
事件 。 一 个 简单 的 事件 只 占据 这 个 时 钟 信号 的 一 个 “滴答 声 " (tick)。 

图 E-20 显示 了 一 个 时 钟 的 抽象 概念 。 我 们 称 它 为 抽象 (abstract)， 是 因为 在 现实 中 ， 没 
有 电路 能 产生 一 个 完全 光滑 的 脉冲 信号 ， 但 这 里 显示 的 信号 对 于 我 们 的 讨论 是 足够 的 。 


电压 


0 时 间 
[一 一 
图 E-20 ”时 钟 脉冲 


如 果 我 们 给 电路 增加 一 个 输入 ,一 个 双 稳 态 多 谐振 荡 器 就 可 以 是 同步 的 ， 这 个 输入 就 是 
时 钟 输入 。 时 钟 输入 可 以 与 每 个 输入 进行 AND (与 ) 运算 ， 从 而 选 通 输入 ， 所 以 只 有 当 有 时 
钟 脉冲 时 ， 它 才 有 效 。 图 E-21 显示 了 我 们 所 讨论 的 所 有 4 种 双 稳 态 多 谐振 荡 器 的 时 钟 版 本 
的 符号 。 图 E-22 显示 了 一 个 带 时 钟 信号 的 SR 双 稳 态 多 谐振 荡 器 的 电路 。 其 他 双 稳 态 多 谐 


振荡 器 有 相同 的 外 加 电路 。 





b ) 时 钟 D 
图 E-21 时 钟 双 稳 态 多 谐振 荡 器 





a) 符号 
图 E-22 时钟 SR 双 稳 态 多 谐振 荡 器 的 电路 


3. 寄存 器 
作为 同步 (时 钟 ) 时 序 电路 的 第 一 个 应 用 ， 我 们 将 介绍 一 个 寄存 器 的 简化 版 本 。 寄 存 器 
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是 一 个 n 个 二 进 制 位 的 存储 设备 ， 它 在 连续 的 时 钟 脉冲 间 存 储 它 的 数据 。 在 时 钟 的 触发 下 ， 


老 的 数据 被 抛弃 ， 被 新 的 数据 替代 。 
图 E-23 显示 了 一 个 4 位 的 寄存 器 ， 每 个 单元 是 由 一 个 D 双 稳 态 多 谐振 荡 器 构成 的 。 注 


意 : 时 钟 输入 对 所 有 单元 是 共有 的 。 我 们 旋转 了 我 们 以 前 的 符号 ， 这 样 使 得 连接 更 为 简单 。 





E-23 一 个 4 位 寄存 器 


4. 数字 计数 器 
一 个 nn 位 的 数字 计数 器 ( digital counter) 能 从 0 计数 到 2 一 。 例 如 ，m=4 时 ， 计 数 器 的 
输出 是 0000，0001，0010，0011，…，1111， 所 以 它 能 从 0 计数 到 15。 一 个 到位 的 计数 


器 可 以 由 nn 个 T 双 稳 态 多 谐振 荡 器 构成 。 在 开始 时 ， 计 数 器 代表 0000， 计 数 允 许 线 (参见 
图 E-24 ) 带 有 1 的 队列 ， 也 就 是 被 计数 的 数据 (脉冲 )。 看 一 下 事件 的 序列 ， 我 们 可 以 看 到 
最 右边 的 位 与 计数 使 能 连接 线 的 每 一 个 正 的 转变 相反 ， 这 模拟 了 数据 项 的 达到 。 但 最 右边 的 
位 从 1 变 成 0， 紧 挨 着 最 右边 的 一 位 就 被 求 补 了 。 这 个 过 程 对 所 有 的 位 重复 。 这 个 观察 给 了 
我 们 使 用 T 双 稳 态 多 谐振 荡 器 的 一 条 线索 。 这 个 双 稳 态 多 谐振 荡 器 的 特征 表 显 示 了 每 个 值 为 
1 的 输入 都 对 输出 求 补 。 注 意 : 这 个 计数 器 只 能 数 到 15 或 (1111),。 第 16 个 数据 项 的 到 达 将 
把 计数 器 重 置 回 到 (0000):。 图 E-24 显示 了 4 位 计数 器 的 电路 。 


计数 使 能 





图 E-24 一 个 4 位 计数 器 
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Foundations of Computer Science, Fourth Edition 


C、C++ 和 Java 程序 示例 


在 本 附录 中 ， 我 们 介绍 一 些 用 三 种 编程 语言 C、C++ 和 Java 写 的 例子 ， 整 体 上 给 出 这 
三 种 编程 语言 的 结构 概念 。( 注 意 每 行程 序 边 上 的 行 号 不 是 该 程序 的 一 部 分 ， 添 加 行 号 是 为 
了 引用 方便 。 也 要 注意 ， 在 程序 编译 成 机 器 语言 时 ， 着 色 标 出 的 注释 文字 是 被 编译 器 忽略 
掉 的 。 


F.1 用 C 语言 编程 
这 一 节 我 们 用 C 语言 来 示例 3 个 简单 的 程序 。 目 标 不 是 教 编程 语言 ， 只 是 给 你 一 个 用 


C 编程 是 什么 样 的 概念 。 
程序 F-1 是 用 C 语言 写 的 最 简单 的 程序 ， 该 程序 打印 出 “Hello World!” 信息。 
这 是 一 个 只 用 顺序 结构 的 例子 ， 意味 着 代码 逐 行 执行 ， 没 有 分 支 或 者 循环 。 
程序 F-1 第 一 个 C 语 言 写 的 程序 
/* 
This program show how we can use only sequence construct 


to achieve a simple goal， 


~ 


#include<stdio.h> 


oem N ks 


int main() 

9 1{ 

10 //Statement 

11 printf ("Hello Word\n"); 
1 return 0; 


14 }//End of main 
Run: 
Hello Word 





时 程序 F-2 用 C 语言 写 的 简单 程序 ， 该 程序 同时 用 到 了 顺序 和 分 支 结 构 。 如 果 条 
件 成 立 ， 程 序 执行 一 些 行 ; 如 果 不 成 立 ， 则 执行 男 一些 行 。 我 们 运行 该 程序 两 次 来 显示 不 同 


的 情况 。 


1 
2 
3 
4 
5 
6 
7 
8 
9 


程序 F-2 ”第 二 个 C 语 言 写 的 程序 
/* 
This program shows how to make a decision in a program written in C. 
The program gets an integer and finds if it is divisible by 7. 
Sf 


#include<stdio.h> 


int main {() 
{ 
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10 //Declaration 

11 int num; 

12? //Statement 

13 printf ("Enter an integer:"); 

14 scanf ("%d", tnum)，; 

15 //Selection 

16 if(num %% 7 == 0) 

17 { 

18 printf ("The number %d",num); 

19 printf ("is divisible by 7.\n"); 
20 } 

下 else 

22 { 

23 printf ("The number %d",num); 

24 printf ("is not divisible by 7.\n"); 
25 } 

26 return 0; 

27 }//End cf main 

Run: 


Enter an integer:24 
The number 24 is not divisible by 7， 


Run: 
Enter an integer:35 
The number 35 is divisible by 7. 


程序 F-3 显示 了 顺序 和 循环 结构 的 组 合 。 我 们 利用 循环 重复 打印 一 个 数字 ,但 
是 该 数字 每 次 重复 时 都 有 变化 。 我 们 运行 两 遍 程 序 。 第 一 次 限制 为 6， 第 二 次 限制 为 9。 


程序 F-3 ”第 三 个 C 语 言 写 的 程序 








/* 
This program shows how to use repetition in C. 
The program prints number from 1 to n, in which n is given by the user. 


f/f 
#include<stdio.h> 


int main{) 

{ 

10 //Declaration 

11 int n; 

12 int 41} 

13 //Statement 

14 printf("Enter the upper limit:"); 
15 scanf ("%d", &n); 

16 //Repetition 

17 for (i=1;i<=n;i++) 


(OO DDN kb. 


18 { 

19 printf("%d\n",i);» 
20 } 

21 return 0; 

22 }//End of main 

Run: 

Enter the upper limit:6 
1 


2 


C、C++ 和 Java 程 庐 示例 405 


Run: 
Enter the upper limit:9 


F.2 用 C++ 语言 编程 
这 一 节 展 示 如 何 用 C++ 语言 来 写 前 面 同样 的 3 个 程序 。 关 键 点 在 显示 两 者 之 间 的 相似 
性 和 不 同 处 。C 语言 是 没有 类 和 对 象 的 过 程 语 言 。 而 C++ 语言 则 是 可 以 有 类 和 对 象 的 面向 
对 象 语言 。 
程序 F-4 实现 了 与 程序 F-1 相同 的 目标 ， 但 却 是 用 C++ 语言 代替 了 C 语言 来 
写 的 。 我 们 可 以 在 第 14 行 看 到 主要 的 差别 。 在 C++ 中 打印 数据 ， 我 们 需要 使 用 一 个 对 象 。 
术语 cout 定义 了 一 个 负责 输出 数据 的 对 象 。 


程序 F-4 ”第 一 个 C++ 语言 写 的 程序 


1 7 
2 The program demonstrates some of the components of a simple 
3 program written in C++ 

4 */ 

5 

6 #include<iostream> 

7 #include<iomanip> 

8 

9 using namespace std; 

10 

11 int main () 

2 { 


二 //Statement 

14 cout << "Hello World" << endl; 

15 return 0;} 

16 }//End of main 

Run: 

Hello World 

时 程序 F-5 实现 了 与 程序 F-2 相同 的 目标 ， 但 却 是 用 C++ 语言 代替 了 C 语言 来 
写 的 。 该 程序 和 它 的 C 版 本 主要 的 差别 在 第 16、17、21、22、26 和 27 行 。 这 些 地 方 我 们 
需要 使 用 输入 对 象 (cin) 和 输出 对 象 (cout) 用 于 输入 和 输出 。 


程序 F-5 ”第 二 个 C++ 语言 写 的 程序 





1 /* 
2 This program Shows how to make a decision in a program written in C++， 
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Le 
13 
14 
» 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
之 9 
30 


The program gets an integer and prints it if it is less than 5350. 
Ff 


#include<iostream> 
#include<iomanip> 


using namespace stad; 


int main () 
{ 
//Declaration 
int num; 
//Statement 
cout << ("Enter an integer:"); 
cin >> num; 
//Decision 
if{(num 务 7 == 0) 
{ 
count << "The number" << num; 
count << "is divisible by 7." << endl; 
} 
else 


{ 
count << "The number’” << num; 


count << "is not divisible by 7." << endl; 
} 
return 0; 
}//End of main 


Run: 

Enter an integer:22 

The number 22 is not divisible by 7. 
Run: 

Enter an integer:21 

The number 21 is not divisible by 7. 








程序 F-6 实现 了 与 程序 F-3 相同 的 目标 ,但 却 是 用 C++ 语言 代替 了 C 语言 来 


写 的 。 该 程序 和 它 的 C 版 本 主要 的 差别 在 第 17、18 和 23 行 。 这 些 地 方 我 们 需要 使 用 输入 
对 象 (cin ) 和 输出 对 象 (cout) 用 于 输入 和 输出 。 


DOIN -~ 


程序 F-6 ”第 三 个 C++ 语言 写 的 程序 


/* 
This program shows how to use repetition In C++. 
The program prints number from 1 to n,in which n is given by the user. 


Ww 


#include<iostream> 
#include<iomanip> 


using namespace std; 


int main() 


{ 
//Declaration 


int n? 
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16 //Statement 
17 cout << "Enter the upper limit:"; 
19, cin > ns 


20  //loop 

21 for(int i=];i<=n;i++) 
22 1 

3 cout << i << endl; 
24 |} 


26 return 0); 

27 }//End of main 

Run: 

Enter the upper limit 4 


Run ; 
Enter the upper limit 8 


DI sON bp 





F.3 用 Java 语言 编程 
这 一 节 ， 我 们 展示 如 何 用 Java 语言 来 写 前 面 同样 的 3 个 程序 。 关 键 点 在 显示 语言 之 

间 的 相似 性 和 不 同 处 。 我 们 遇 到 的 第 一 个 不 同 之 处 是 在 C++ 中 的 main 函数 和 在 Java 中 的 
main 方法 。 在 C++ 中 的 main 函数 是 独立 的 程序 ， 在 Java 中 的 main 方法 应 该 是 一 个 类 的 一 
部 分 。 我 们 分 别 在 这 些 程序 中 命名 这 些 类 为 Fist、Second、Third。 : 

程序 F-7 实现 了 与 程序 F-4 相同 的 目标 ， 但 却 是 用 Java 语言 代 替 了 C++ 语言 
来 写 的 。 我 们 需要 一 个 类 来 提供 main 方法 。 另 一 个 不 同 之 处 是 在 第 10 行 ， 我 们 使 用 一 个 预 
先 定义 的 对 象 (System.cout) 负责 输出 。 


程序 F-7 ”第 一 个 Java 语 言 写 的 程序 


1 /* 
2 This program demonstrates some of the components of a simple 
3 program written in Java 

4 

5 

6 Public class First 

和 坷 

8 public static void mainl(String[] args) 

9 ( 

10 System.out .printIin ("Hello World!"); 
11 }//End main 


12 }//End class 
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程序 F-8 实现 了 与 程序 F-5 相同 的 目标 ， 但 却 是 用 Java 语言 代替 了 C++ 语言 


来 写 的 。 我 们 需要 一 个 类 来 提供 main 方法。 其 他 不 同 之 处 是 在 第 13、14、15、20、21、 
26 和 27 行 ， 那 里 我 们 使 用 一 个 类 的 对 象 Scanner 负责 输入 ， 以 及 一 个 预先 定义 的 对 象 


(System.cout) 负责 输出 。 


OI N 


$4 
12 
13 
14 
13 
16 
17 
18 
19 
20 
21 
22 
23 
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25 
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28 
29 
30 
31 
32 


程序 F-8 第 二 个 Java 语 言 写 的 程序 


/* 
This program shows how to make a decision in a program written in Java. 
The program gets an integer and checks if it is divisible by 7. 


ep 
import java.util.*; 


public class Second 
{ 
public static void main(Stirng[] args) 
| 
//Declaration 
Scanner input = new Scanner (System.in); 
System.cut .print ("Enter an integer:");} 
int num = input.nextInt (); 


//Decision 

if (num 有 7 == 0) 

{ 
System,.out.print ("The number" + num) ; 
System.out.printIin("is divisible by 7"); 


} 
else 


人 
System.out.print ("The number" + num) ; 


System.out .printIn("is not divisible by 7."); 


} 
}//End main 


}//End class 


Run: 

Enter an integer:25 

The number 25 is not divisible by 7. 
Run: 

Enter an integer:42 

The number 42 is divisible by 7， 





程序 F-9 实现 了 与 程序 F-6 相同 的 目标 ， 但 却 是 用 Java 语言 代替 了 C++ 语言 


来 写 的 。 我 们 需要 一 个 类 来 提供 main 方法 。 其 他 不 同 之 处 是 在 第 13、14、15 和 20 行 ， 那 
里 我 们 使 用 一 个 类 的 对 象 Scanner 负责 输入 ， 以 及 一 个 预先 定义 的 对 象 ( System.cout) 负责 


输出 。 


1 
2 


程序 F-9 ”第 三 个 Java 语 言 写 的 程序 


/* 
This program shows how to se a loop in Java. 
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3 The program prints number from 1 to n,in which n is given by the user. 
4 去 1 

5 

6 import java.util.*; 

- 

8 public class Third 

六 

2 public static void main(Stirng[] args) 

3 ( 

4 //Statements to get the value of n 

5 Scanner input = new Scanner (System.in),; 
6 Scanner.out ,print ("Enter the upper limit:"); 
7 int n = input.nextInt(); 

8 

9 //Loop 

10 for (int 3 = :17i<= ni++) 

11 { 

1 System.out .PrintIn (i); 

13 ) 

14 }//End main 

15 

16 }//End class 

Run: 

Enter the upper limit:3 

1 

2 

3 

Run: 


Enter the upper limit:7 


J 直 oOUb Ww N . 
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”在 附录 的 这 一 部 分 ， 我 们 将 复习 一 些 数学 概念 ， 它 们 能 帮助 我 们 理解 本 书 中 的 主题 。 我 
们 首先 给 出 一 个 简短 的 关于 指数 和 对 数 函数 的 论述 ， 接 着 讨论 模 运 算 ， 最 后 ， 我 们 给 出 在 数 
据 压 缩 中 使 用 的 离散 余弦 变换 的 公式 。 


G.1 指数 和 对 数 
在 本 书 一 些 问题 的 求解 过 程 中 ， 我 们 经常 需要 知道 如 何 处 理 指数 和 对 数 函数 。 这 一 节 我 
们 简短 地 回顾 一 下 这 两 个 概念 。 


G.1.1 指数 函数 z 

底 (base) 为 a 的 指数 函数 定义 为 a。 如 果 x 是 一 个 整数 ， 这 个 可 以 解释 成 a 与 自身 相 
乘 了 x 通常 我 们 可 以 使 用 一 个 计算 器 得 到 y 的 值 。 
em 区 计算 下 列 指数 函数 的 值 。 





b. 5.2° 

解 ” 使 用 关于 指数 的 解释 ， 我们 有 : 

a 3 =XK3509 

b. 5.26=5.2X5.2X5.2X5.2X5.2X5.2=19 770.609 664 
计算 下 列 指数 函数 的 值 。 


.3 


村 

解 ”这些 问题 使 用 计算 器 更 容易 解决 ,我 们 有 : 

卫 

b. .2 和 =:32 424.60 

1. 三 个 常用 的 底 

在 表达 式 a* 中 ， 我 们 称 a 为 底 ，4。 为 指数 。 三 个 常用 的 底 是 : 底 10、 底 e 和 底 2。 

。 底 10 是 十 进 制 系统 的 底 。 大 多 数 计 算 器 上 都 有 一 个 10” 键 。 

。 在 科学 和 数学 中 使 用 的 底 是 自然 底 e ( natural base e)，e 的 值 为 2.718 281 83…， 大 
多 数 计算 器 上 都 有 一 个 e* 键 。 因 为 诸如 放射 性 衰变 这 些 现 象 可 以 用 这 个 底 得 到 最 好 
的 描述 ， 所 以 这 个 底 用 在 科学 方面 。 

。 在 计算 机 科学 中 通常 需要 的 底 是 2。 大 多 数 计算 器 上 虽然 没有 2* 键 ， 但 我 们 可 以 使 用 
一 般 的 ?人 键 ， 设置 x=2。 

人 计算 下 列 指数 函数 的 值 。 

ae 

b. e63 

c. 102” 
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~ $54.60 
b. ~ 544.57 
c. 10™ a= 1995.26 
d, 2 一 78.79 
pe 
在 计算 机 科学 中 ， 占 主导 地 位 的 底 是 2。 知 道 一 些 常用 指数 2 的 才 是 一 个 好 的 
实践 我 们 经 党 需要 记 人 


a 2 2 Ss a : SR 24=16 人 3 3 0 
0 3 i \ 
2. 指数 函数 的 性 质 
指数 夯 数 有 多 个 性 质 ， 其 中 一 些 对 我 们 非常 有 用 ; 
0 a 人 


人 Ri. a pe 0 二 渍 的 放生 
使 用 这 些 性 质 的 例子 有 : 





a. 5*= 1 

b. 6'=6 

c, 2™*= 1/24= 1/16 = 0.0625 
d.2™"=2X2 = 32X8=256 

e, 3 = 3%/3’= 9/27= 1/3 = 0.33 

f (10 人 = 10 和 = 10*= 100 000 000 


G.1.2 ”对 数 函 数 
对 数 函数 是 指数 函数 的 倒数 ， 表 示 如 下 : 
ya «+ logay 
就 像 在 指数 函数 中 一 样 ，a 被 称 为 对 数 函 数 的 底 。 换 言 之 ， 如 果 给 定 x， 我们 可 以 使 用 
ese er 如 果 给 定 y， 我 们 可 以 使 用 对 数 函 数 计算 出 x。 
“指数 本 歼 和 对 数 画 数 互 为 合 数 。 
因为 对 数 能 把 乘法 运算 转变 为 加 法 运算 ， pup 本 所 以 它 使 算术 中 


的 计算 变 得 容易 了 。 
em 时 计算 下 列 对 数 函 数 的 值 : 








a. ]og39 
b. log216 


C, logio0 


d.log:(-2) 
解 我们 还 没有 介绍 如 何在 不 同 的 底 上 计算 对 数 函 数 ， 但 我 们 可 以 直观 地 解决 这 些 问题 。 
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a. 因为 3*:=9， 所 以 log39=2， 使 用 这 两 个 函数 互 为 倒数 这 个 事实 。 

b. 相似 地 ， 因 为 2:=16， 所 以 logz16=4。 

c. 因为 不 存在 有 限 数字 x， 使 得 10*=0， 所 以 logio0 就 是 无 意义 的 或 数学 上 的 负 无 穷 大 。 

d. 在 实数 数学 中 ， 负 数 是 无 对 数 的 。 但 是 在 复杂 数字 领域 中 ， 我 们 是 可 以 有 负数 的 对 数 
的 ， 这 里 ， 我 们 把 这 些 问题 留 给 关于 复杂 数字 理论 的 书 。 

1. 三 种 常用 的 底 

与 指数 函数 的 情况 一 样 ， 对 数 中 也 有 三 个 常用 的 底 : 底 10、 底 e 和 底 2。 以 e 为 底 的 对 
数 通常 写成 In (自然 对 数 )， 以 10 为 底 的 写成 log (省 略 了 底 )。 有 
为 及 的 对 开间 我 们 马上 会 显示 如 何 处 理 这 个 底 。 
计算 下 列 对 数 函 数 的 值 : 





a, log233 

b. jn45 

解 ” 对 于 这 两 个 底 ， 我 们 能 使 用 计算 器 : 

a. log233 ~ 2.367 

b. In45 ~ 3.81 

2. 底 转 换 

我 们 经 常 需 要 求 一 个 底 既 不 是 e 也 不 是 10 的 对 数 函 数 的 值 。 如 果 手 头 的 计算 器 不 能 给 
出 我 们 希望 的 结果 ， 那 么 我 们 可 以 使 用 对 数 函 数 的 基本 特性 ( 底 转换 )， 显 示 如 下 : 

logay 
logwy = logsa , 

注意 ， 右 边 显示 了 两 个 以 5 为 底 的 对 数 函数 ， 它 与 左边 以 a 为 底 的 不 同 。 这 就 意味 着 我 

们 可 以 选择 一 个 在 我 们 计算 器 上 可 用 的 底 ( 底 0)， 计 算出 计算 器 上 没有 的 底 ( 底 a) 的 对 数 。 
计算 下 列 对 数 函 数 的 值 : 

a. log3810 

b, logs600 

c. log21024 

d. log2600 

解 ” 这 些 底 通常 在 计算 器 上 都 没有 有， 但 我 们 可 以 使 用 底 10， 这 是 计算 器 上 有 的 。 

a. log3810= log810/log3=2.908/0.477 守 6.095 

b. logs600=1log600/log5=2.778/0.699~3.975 

c. log21024= log1024/log2=3.01/0.301= 10 

d. log2600 =1log600/log2 守 2,778/0.301 守 9,223 
多 底 2 在 计算 机 科学 中 非常 普遍 。 既 然 我 们 知道 logio2 = 0.301, 这 就 非常 容易 计 
算出 (近似值 ) 这 个 底 的 对 数 。 我 们 先 求 出 这 个 数 以 10 为 底 的 对 数 ， 再 除 以 0.310。 或 者 在 
这 个 以 10 为 底 的 对 数 上 乘 以 3.332 (= 1/0.301 ) 。 

a. log2600 ~ 3.332Xlogio600 一 3.332X2.778 一 9.228 

b. log22048 一 3.332X logi02048 守 3.332X2.778 = 11 

3. 对 数 函 数 的 性 质 

对 数 函数 有 6 个 有 用 的 性 质 ， dnt msi 


go 可 lop/(xXW)=loga tlogay el a A 











a - logs) = logt-logy a 
logs(1/x) =-logsx -2 1 ee logax”= yXlogx A El 
em 计算 下 列 对 数 函 数 的 值 

a. log;] 

b. log33 

c. log(1/10) 


d. loga(xXy)， 如 果 知 道 logox =2 和 logsy=3 

e, logs(x/y)， 如 果 知 道 logox=2 和 1logsy =3 

f log2(1024)， 不 使 用 计算 器 

解 ”我 们 利用 对 数 函 数 的 性 质 来 解决 这 些 问题 : 
a. log3l=0 

b. log33=1 

c. log(1/10)=log10"=-log10=-1 

d. logs(x Xy)=logox + logay =2 + 3=5 

e. logs (x/y)=1logox-logsy=2-3=-] 

f log2(1024)=1log2(2'")=10X1log;2=10X 1=10 


G.2 模 运 算 

在 整数 运算 中 ， 如 果 我 们 用 a 除 以 nx， 就 能 得 到 g 和 r。4 个 整数 间 的 关系 可 以 写成 ， 
a=q Xntr。 在 这 个 等 式 中 ，a 称 为 被 除数 ，n 为 除数 ，g 为 商 ,r 为 余数 。 既 然 一 个 运算 通常 
定义 成 带 有 一 个 单一 的 输出 ， 所 以 这 个 等 式 不 是 运算 ,我 们 称 之 为 除法 关系 (division 


Telation ) 。 











em 假定 ac=214，m=13， 用 我 们 

在 六 下 中 革 学业 除法 ， 可 以 得 出 所 16， 产 6。 一 13 | 54+ 一 。 
如 图 G-1 所 示 。 有 直 

大 多 数 计算 机 语言 可 以 使 用 语言 指定 的 | 高， 
运算 符 求 得 商 和 余数 。 例 如 ， 在 C 语 言 中 ， et 
除法 运算 符 (/) 可 以 得 出 商 ， 模 运算 符 ( %) 图 G-1 整数 除法 
可 以 得 出 余数 。 
G.2.1 模 运 算 符 


在 模 运 算 中 ， 我 们 只 对 一 个 输出 (余数 7) 感 兴趣 ， 我 们 不 关心 商 gq。 换言之 ， 当 a 除 以 
n 时 ， 我们 想 要 知道 的 是 + 的 值 是 多 少 。 这 就 意味 着 可 以 把 上 面 的 关系 转换 成 带 有 两 个 输入 
a 和 与 一 个 输出 r 的 二 元 运算 。 那 么 这 个 二 元 运算 符 被 称 为 模 运 算 符 ( modulo operator)， 
表示 成 mod。 第 二 个 输入 (n) 称 为 模 数 (modulus)， 输 出 > 称 为 余数 (residue)。 图 G-2 显 
示 了 除法 关系 与 模 运 算 符 的 比较 。 

模 运 算 符 带 一 个 整数 (a) 和 一 个 模 数 (n)， 得 到 余数 (r)。 虽 然 a 和 可 以 是 任何 整数 ， 
但 不 能 为 0， 因 为 否则 得 出 除 以 0， 这 会 产生 一 个 无 定义 或 无 穷 大 的 数 。 但 在 实际 中 ， 我 
们 要 求 n 的 值 为 非 负 数 。 由 于 这 个 原因 ，r 的 值 应 该 在 0 与 n-1 之 间 。 
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| (运算) 





图 G-2 除法 关系 与 模 运算 符 


enab 使 用 模 运 算 一 个 非常 好 的 例子 是 时 钟 系统 。 时 钟 是 基于 模 12 运算 的 。 但 是 时 
钟 上 的 整数 12 实际 上 应 该 是 0， 这 样 使 它 与 模 运 算 相 一 致 。 

求 下 列 运算 的 结果 : 

a. 28 mod 6 

b. 32 mod 12 

c, 19 mod 15 

d.7 mod 11 

解 ” 我 们 求 余 数 r， 可 以 用 nn 除 a， 得 到 g 和 rr。 丢弃 g, 保存 r。 

a. 28 除 以 6 得 到 一 4， 这 意味 着 28 mod 6=4。 

b. 32 除 以 12 得 到 r=8， 这 意味 着 32 mod 12=8。 

c. 19 除 以 15 得 到 r=4， 这 意味 着 19 mod 15=4。 

d. 7 除 以 11 得 到 一 7， 这 意味 着 7 mod 11=4。 


G.2.2 算术 运算 
我 们 在 整数 中 讨论 的 三 种 二 元 运算 (加 法 、 减 法 和 乘法 ) 也 可 以 针对 模 运 算 定 义 。 如 果 
结果 大 于 n-1， 我 们 可 能 需要 规范 化 结果 (应 用 








mod 运算 ， 取 余数 )， 如 图 G-3 所 示 。 运算 

实际 上 ， 这 里 有 两 组 二 元 运算 符 ， 第 一 组 是 二 (a+b)mod n=c 
元 运算 符 (+、-、x ) 中 的 一 个 ， 第 二 组 是 mod 运 (a-b)mod n=c 
算 符 。 我 们 需要 使 用 括号 来 强调 运算 的 顺序 。 在 计 lac at 
算 过 程 中 的 任何 时 候 ， 如 果 得 到 一 个 负 值 的 >， 这 
个 值 就 应 该 规范 化 。 我 们 需要 在 这 个 结果 上 加 上 模 


才 和 次， 直到 这 个 结果 为 正 为 止 。 图 G-3” 模 运算 中 的 三 种 运算 
emb 进行 下 列 运 算 : 

a, yy 以 15 为 模 

b.7 减 11， 以 13 为 模 

c. 11 乘 以 7， 以 20 为 模 

解 下 面 显示 了 涉及 每 个 问题 的 两 步 : 

(14+7)mod15 一 (21)mod 15=6 

(7-ll)mod 13 一 (-4) mod 13=-4+ 13=9 

(7X1l) mod20 一 (77) mod 20=17 
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已 Re 进行 下 列 运算 : 

a. 17 加 上 27， 以 14 为 模 

b. 12 减 43， 以 15 为 模 

c. 123 乘 以 -10， 以 19 为 模 

解 ”注意 : 这 些 例子 中 的 整数 有 时 超出 了 0 到 n-1 的 范围 ， 我 们 可 以 在 运算 前 规范 化 它 
们 ， 也 可 以 在 运算 后 进行 。 我 们 显示 的 是 第 二 种 选择 ， 读 者 可 以 试 一 下 第 一 种 选择 ， 二 者 的 
结果 是 相同 的 。 

(17 + 27) mod 14 一 (44) mod 14=2 

(12-43) mod 15 一 (-31) mod 15=-]1+15=4 

(123X-10) mod 19 — (-1230) mod 19=-14 + 19=5 

模 2 运算 

模 2 运算 具有 特殊 的 意义 。 因 为 模 是 2， 我们 能 使 用 的 值 只 有 0 和 1。 这 样 的 算术 运算 
是 非常 简单 的 。 下 面 显示 了 我 们 是 如 何在 两 位 间 进 行 加 减 的 。 


加 : (0+0) mod 2=0 (0+ 1) mod 2=1 
(1 十 0) mod 2=1 (1+1) mod 2=0 

减 : (0-0) mod 2=0 (0-1) mod 2=1 
(1-0) mod 2=1 (1-1) mod 2=0 


特别 要 注意 的 是 加 法 和 减法 给 出 了 相同 的 结果 。 在 这 种 算术 中 ， 我 们 可 以 用 XOR ( 异 
或 ) 运算 来 代替 加 减法 。 如 果 两 位 是 相同 的 ，XOR 运算 的 结果 为 0; 如 果 两 位 不 同 ， 则 为 1。 
图 G-4 显示 了 这 个 运算 。 


0@0=0 1@1=0 


a ) 两 位 相同 ， 结 果 为 0 


0@1=1 1@0=1 


b ) 两 位 不 同 ， 结 果 为 1 c ) 两 个 字 异 或 的 结果 
图 G-4 ”两 个 一 位 的 异 或 与 两 个 字 的 异 或 





G.3 ”离散 余弦 变换 

本 节 我 们 给 出 离散 余弦 及 反 离散 余弦 变换 的 数学 背景 ， 这 种 变换 被 用 在 第 15 章 中 所 讨 
论 的 数据 压缩 中 。 
G.3.1 离散 余弦 变换 


在 这 项 变换 中 ， 每 个 64 像素 的 块 进行 称 为 离散 余弦 变换 ( DCT) 的 转变 。 该 转变 改变 
了 这 64 个 值 ， 以 便 保持 像素 间 相 关 的 关系 而 去 掉 元 余 。 下 面 的 公式 中 ，P(x, y) 定义 了 图 像 
块 中 一 个 特定 的 值 ，7(m, n) 定义 了 在 转换 后 的 块 中 的 一 个 值 。 


Fe; 
T(m,n) = 0.25c(m)c(n) > > P(x,y)eos[ CE + mr | cos| (2y 后 ma] 
x=0y=0 


1 
! 一 一 若 1=0 
其 中 ci) =( 六 
] 其 他 
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G.3.2 反 离 散 余弦 变换 
该 反 变换 用 于 从 7T(m, n) 表 中 创建 P(x,y) 表 。 


| py 
P(x,y) = 0.25c(x)c(y) 5 5 Mn)oo mt eo | 


] 
6 
其 中 c(i) ee. 其 他 


加 Ke 人 如 果 对 于 所 有 的 x 和 yy，P(x, y)=20, 计算 7(0, 0) 和 7(0, 1)。 
解 ” 使 用 和 之 积 恒 等 变换 cosx + cosy=2[cos(x +y)/2][cos(x-y)/2]， 我 们 可 以 看 出 所 有 余 
绞 项 之 和 为 0。 
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Foundations of Computer Science, Fourth Edition 


和 共识 检测 和 纠正 


当 数 据 从 一 个 地 方 传输 到 另 一 个 地 方 ， 或 从 一 个 设备 移动 到 另 一 个 设备 时 ， 必 须 检 查 数 
据 的 准确 性 。 在 大 多 数 应 用 中 ， 系 统 必须 保证 接收 到 的 数据 和 传输 的 数据 是 相同 的 。 有 些 应 
用 却 能 容忍 小 的 错误 。 例 如 ， 在 音频 和 视频 传输 过 程 中 随机 错误 是 可 以 容忍 的 ， 但 传输 文本 
时 ， 我 们 希望 准确 性 非常 高 。 我 们 虽然 只 讨论 传输 中 的 错误 ， 但 在 存储 中 由 于 数据 损坏 产生 
的 错误 也 以 同样 的 方法 来 处 理 。 


H.1 引言 
我 们 先 讨论 与 错误 检测 和 纠正 有 关 的 一 些 问题 。 


H.1.1 错误 的 种 类 


由 于 传输 介质 中 的 和 干扰， 如 串扰 、 外 部 的 电磁 场 等 ， 不 管 何 时 数据 位 从 一 个 地 方 流向 另 
一 个 地 方 ， 它 们 总 要 遭受 不 可 预见 的 变化 ， 如 图 H-1 所 示 。 





发 送 发 送 间 错 误 的 长 度 (8 位 ) 
olololololilo| 0|1|ololol1lolololtlololololtli 
| am 
0|olo|o 吕 ol1|o， 品目 日， 四 器 ol1 ， 口 口 吕 加 加 
接收 接收 
a ) 单位 错误 b ) 区 间 错 误 


图 H-1 单位 错误 与 区 间 错 误 


在 单位 错误 ( single-bit error) 中 ，0 变 成 1 或 1 变 成 0。 在 区 间 错 误 (burst error) 中 ， 
多 位 被 改变 。 单 位 错误 的 意思 是 在 所 给 的 数据 单元 (如 一 个 字 节 、 一 个 字符 或 一 个 数据 包 ) 
中 ， 只 有 一 位 从 1 变 成 0, 或 从 0 变 成 1。 区 间 错 误 的 意思 是 在 数据 单元 中 有 两 位 或 两 位 以 


上 从 1 变 成 0 或 从 0 变 成 1。 
H.1.2， 元 余 


纠正 错误 中 的 中 心 概念 就 是 宛 余 (redundancy)。 为 了 能 纠正 错误 ， 需 要 与 数据 一 起 传 
送 额 外 的 数据 位 。 这 些 元 余 位 由 发 送 者 加 上 ， 由 接收 者 移 除 。 它 们 的 存在 允许 接收 者 纠正 损 
坏 的 数据 位 。 


sp 和 ， 7 ee 下 和 rr 一 =- er sa nEO AT - "¢ .4 
MY Ni i A I RY LV Dr od des Td tt 
“ “为 了 纠正 错误 ， 需 要 与 数据 一 起 发 【元 和 | 
> < - 。 | ~ Ny sie dd = 
2 六 和 2 2 和 ， 
-3 SP 和 < ee 1 下 了 rs UDC -和 pd 
2 】 - Eg < -=p > I ~ 4 4 “Bo b> - er ar 一 | 





H.1.3 检测 与 纠正 


错误 的 纠正 比 检测 困难 得 多 。 在 错误 检测 ( error detection) 中 ， 我 们 只 看 一 下 是 否 有 错误 ， 
答案 是 简单 的 有 或 无 。 我 们 甚至 不 关心 错误 的 数目 ， 对 我 们 来 说 单位 错误 和 区 间 错 误 是 一 样 的 。 
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在 错误 纠正 中 ,我们 需要 知道 损坏 位 的 准确 数目 ， 更 重要 的 是 它们 在 消息 中 的 位 置 。 错 
误 的 数目 和 消息 的 大 小 都 是 重要 的 因素 。 如 果 需 要 在 8 位 数据 单元 中 纠正 一 个 错误 ， 我 们 需 
要 考虑 8 种 可 能 的 错误 位 置 。 如 果 在 同样 大 小 的 数据 单元 中 纠正 两 个 错误 ,我 们 需要 考虑 
28 (7+6+…+1) 种 可 能 性 。 你 可 以 想象 一 下 接收 者 在 1000 位 的 数据 单元 中 找到 10 个 错 


误 的 难度 。 


H.1.4 向 前 错误 纠正 与 重 传 


有 两 种 错误 纠正 的 主要 方法 。 向 前 错误 纠正 (forward error correction) 是 接收 者 用 元 余 
位 去 努力 猜测 消息 的 过 程 。 如 果 错 误 数 目 比较 小 ， 这 是 有 可 能 的 ， 正 如 我 们 后 面 会 看 到 的 。 
重 传 (retransmission) 纠正 是 接收 者 检测 到 错误 ， 要 求 发 送 者 再 次 发 送 消息 的 技术 。 重 发 是 
一 个 重复 的 过 程 ， 直 到 接收 者 相信 到 达 的 数据 是 无 错误 的 。 通 常情 况 下 ， 不 是 所 有 的 错误 都 


能 被 检测 到 。 


H.1.5 编码 

元 余 可 以 通过 各 种 编码 方案 来 实现 。 发 送 者 通过 创建 元 余 位 和 实际 数据 位 间 的 关系 的 过 
程 来 增加 完 余 位 。 接 收 者 检查 两 组 数据 位 来 检测 或 纠正 错误 。 元 余 位 和 数据 位 的 比例 以 及 过 
程 的 健壮 性 是 任何 编码 方案 的 重要 因素 。 图 H-2 显示 了 编码 的 一 般 概念 。 


接收 者 





图 H-2 编码 器 和 译 码 器 的 结构 


可 以 把 编码 系统 分 成 两 大 类 : 块 编码 (block coding) 和 回旋 编码 ( convolution coding) 。 
本 附录 只 讨论 块 编码 ， 回 旋 编码 比较 复杂 ， 超 出 了 本 书 的 范围 。 块 编码 使 用 模 运 算 ， 正 如 附 


录 G 中 讨论 的 。 


H.2 块 编码 

在 块 编码 中 ， 我 们 把 消息 分 成 块 (每 块 上 位 )， 称 为 数据 字 ( dataword)。 我 们 给 每 个 块 
加 上 r+ 个 元 余 位 ， 使 得 长 度 n=k+r。 得 到 的 n 位 的 块 称 为 码 字 (codeword)。 额 外 的 + 位 是 如 
何 选择 或 计算 的 将 在 后 面 讨论 。 现 在 ， 我 们 知道 有 一 组 数据 字 (每 个 大 小 为 局 和 一 组 码 字 
(每 个 大 小 为 nx)， 这 是 很 重要 的 。 

使 用 位 ， 我 们 能 创建 2* 个 数据 字 组 合 ; 使 用 位， 我 们 能 创建 2 个 码 字 组 合 。 因 为 
n>>k， 所 以 码 字 的 可 能 数目 大 于 数据 字 的 可 能 数目 。 块 编码 过 程 是 一 对 一 的 ， 同 样 的 数据 学 
总 是 编码 成 同样 的 码 字 。 这 就 意味 着 我 们 有 2”-2* 个 码 字 没 有 使 用 ， 称 这 些 码 字 为 无 效 的 或 
非法 的 。 图 H-3 说 明了 这 种 情况 。 
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每 块 2 个 数据 宁 每 块 2* 个 码 字 (其 中 只 有 2* 是 有 效 的 ) 
图 H-3 块 编码 中 的 数据 字 和 码 字 


假设 消息 由 一 个 8 位 的 块 构成 (k=8 )。 这 里 有 25=256 种 可 能 的 数据 字 组 合 。 
如 果 我 们 增加 2 个 元 余 位 (7=2 )， 那 么 每 个 可 能 的 码 字 是 10 位 (n=10 )， 全 部 可 能 的 码 字数 
目 是 2"=1024。 这 意味 着 有 1024-256=768 个 码 字 是 无 效 的 。 如 果 这 些 无 效 的 码 字 被 接收 ， 
那么 接收 者 就 知道 码 字 损坏 了 。 


H.2.1 错误 检测 


错误 是 如 何 用 块 编码 检测 到 的 ? 如果 满足 下 列 两 个 条 件 ， 则 接收 者 就 检测 出 原始 码 字 的 
变化 。 

1 ) 接收 者 有 (或 能 找到 ) 有 效 码 字 表 。 

2 ) 原始 码 字 被 改 成 无 效 的 。 

图 H-4 显示 了 块 编码 在 错误 检测 中 的 作用 。 





图 H-4 块 编码 中 的 错误 检测 过 程 


发 送 者 使 用 生成 器 从 数据 字 中 创建 码 字 ， 生 成 器 应 用 编码 的 规则 和 过 程 (后 面 讨论 )。 
每 一 个 发 送 到 接收 者 的 码 字 在 传输 过 程 中 都 可 能 改变 。 如 果 接 收 的 码 字 与 一 个 有 效 的 码 字 
相同 ， 则 字 被 接受 ， 相 应 的 数据 字 从 中 提取 出 来 使 用 ;如 果 接 收 的 码 字 是 无 效 的 ， 它 就 被 
丢弃 。 

但 是 ， 如 果 码 字 在 传输 过 程 中 受到 损坏 ， 而 接收 字 仍 然 匹配 了 一 个 有 效 的 码 字 ， 那 么 错 
误 仍然 未 被 检测 出 来 。 因 此 ， 这 种 编码 只 能 检测 单个 错误 ， 同 一 码 字 中 的 两 个 或 多 个 错误 可 
能 遗留 而 未 被 检测 出 来 。 

假设 本 2，n=3， 表 H-1 显示 了 数据 字 和 定义 的 码 字 的 列表 ， 这 是 发 送 者 和 接 
收 者 双方 认可 的 。 下 面 我 们 将 显示 如 何 从 一 个 数据 字 推导 出 一 个 码 字 。 


表 H-1 错误 检测 编码 ( 例 H-2 ) 


EPE 本 
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假设 发 送 者 把 数据 字 01 编码 为 011， 然 后 把 它 发 送 给 接收 者 ， 考 虑 下 列 情况 : 

1 ) 接收 者 收 到 011， 这 是 一 个 有 效 的 码 字 ， 接 收 者 从 中 提取 出 数据 字 01。 

2 ) 在 传输 过 程 中 ， 码 字 受 到 损坏 ， 接 收 到 的 是 111， 也 就 是 说 最 左边 的 位 受到 损坏 。 
这 是 一 个 无 效 的 码 字 ， 所 以 它 被 丢弃 。 

3 ) 在 传输 过 程 中 ， 码 字 受 到 损坏 ， 接 收 到 的 是 000， 也 就 是 说 右边 的 两 位 受到 损坏 。 
这 是 一 个 有 效 的 码 字 ， 接 收 者 错误 地 从 中 提取 数据 字 00。 两 位 受到 损坏 使 得 错误 未 被 发 现 。 
“二 种 错误 检测 编码 只 能 检测 出 它 设计 时 针对 的 错误 ， 其 他 类 型 的 错误 可 能 仍然 未 检 
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H.2.2 错误 纠正 

错误 纠正 比 错误 检测 要 困难 得 多 。 在 错误 检测 中 ， 接 收 者 只 需要 知道 接收 的 码 字 是 无 效 
的 ; 在 错误 纠正 中 ， 接 收 者 需要 查找 (或 猜测 ) 发 送 过 来 的 原始 码 字 。 与 错误 检测 相 比 ， 在 
错误 纠正 中 我 们 需要 更 多 的 宛 余 位 。 图 H-5 显示 了 块 编码 在 错误 纠正 中 的 作用 。 我 们 可 以 看 
出 其 思想 与 错误 检测 是 相同 的 ， 但 生成 器 和 检查 器 的 功能 却 要 复杂 得 多 。 





H-5 错误 纠正 中 编码 器 和 详 码 器 的 结构 


罗 相 区 引 对 例 H-2 增加 更 多 的 元 余 位 ， 去 看 看 接收 者 能 否 在 不 知道 实际 传送 数据 的 前 提 
下 纠正 一 个 错误 。 我 们 给 2 位 数据 字 加 上 3 个 元 余 位 ， 构 成 5 位 的 码 字 。 后 面 会 介绍 如 何 选 
择 宛 余 位 。 现 在 我 们 专心 研究 错误 纠正 的 概念 。 表 H-2 显示 了 数据 字 和 码 字 。 


表 H-2 错误 纠正 编码 ( 例 H-3 ) 


JE 可 


假设 数据 字 是 01， 发 送 者 通过 查阅 表格 (或 使 用 算法 ) 建立 了 码 字 01011。 码 字 在 传输 
过 程 中 受到 损坏 ， 接 收 的 是 01001 (右边 的 第 二 位 出 现 了 错误 )。 首 先 ， 接 收 者 发 现 接收 的 
码 字 不 在 表 中 ， 这 意味 着 有 错误 发 生 。( 纠 正之 前 必须 进行 检查 。) 接收 者 假设 只 有 一 位 受到 
损坏 ， 使 用 下 列 策 略 去 猜想 正确 的 数据 字 : 

1 ) 接收 到 的 码 字 与 表 中 的 第 一 个 码 字 进行 比较 (01001 与 00000 )， 因 为 有 两 位 不 同 ， 
所 以 接收 者 认为 第 一 个 码 字 不 是 发 送 过 来 的 字 。 

2 ) 出 于 同样 的 原因 ， 原 始 码 字 不 可 能 是 表 中 的 第 三 和 第 四 个 码 字 。 
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3 ) 原始 码 字 肯定 是 表 中 的 第 二 个 码 字 ， 因 为 它 与 接收 到 的 码 字 间 只 有 一 位 不 同 。 接 收 
者 用 01011 替换 了 01001， 并 通过 查 表 ， 得 到 数据 字 是 01。 


H.3 线性 块 编码 

现在 使 用 的 所 有 块 编码 几乎 都 是 线性 块 编码 (linear block code) 的 子 集 。 错 误 检测 与 纠 
正 的 非 线性 块 编码 之 所 以 没有 被 广泛 使 用 ， 是 因为 它们 的 结构 使 得 理论 分 析 和 实现 都 很 困 
难 。 因 此 ， 我 们 只 关注 线性 块 编码 。 

线性 块 编码 的 正式 定义 需要 抽象 代数 (特别 是 伽 罗 瓦 域 ) 的 知识 ， 这 些 知 识 超出 了 本 书 
的 范围 ， 因 此 我 们 给 出 一 个 非 正 式 的 定义 。 对 于 我 们 的 目的 来 说 ， 线 性 块 编码 是 其 中 两 个 有 
效 码 字 进 行 异 或 运算 ( 模 2 加 法 ， 附 录 G 中 讨论 的 ) 产生 另外 一 个 有 效 码 字 的 过 程 。 


在 线性 块 编码 中 ， 企 意 两 个 有 效 的 码 字 进行 异 或 (XOR) 运算 生成 另 一 个 有 效 码 字 。 
下 面 看 一 下 表 H-1 和 表 H-2 定义 的 编码 是 否 属于 线性 块 编码 。 
1 ) 因为 任意 码 字 与 任意 其 他 码 字 的 异 或 运算 都 是 一 个 有 效 的 码 字 ， 所 以 表 H-1 中 的 方 
案 是 线性 块 编码 。 例 如 ， 第 二 和 第 三 个 码 字 异 或 得 到 第 四 个 码 字 。 
2 ) 表 H-2 中 的 方案 也 是 线性 块 编码 ， 我 们 能 通过 其 他 两 个 码 字 的 异 或 运算 得 出 所 有 4 
个 码 字 。 


H.3.1 一 些 线性 块 编码 
我 们 来 看 一 些 线性 块 编码 。 这 些 编码 是 简单 的 ， 因 为 我 们 能 很 容易 地 找 出 编码 和 译 码 算 


法 ， 并 检查 它们 的 性 能 。 

1. 简单 奇偶 校 验 码 

也 许 最 熟悉 的 错误 检测 编码 是 简单 奇偶 校 验 码 (simple parity-check code)。 在 此 编码 中 ， 
位 的 数据 字 被 改变 成 n 位 的 码 字 ， 这 里 n= 寻 +1。 额 外 的 位 ( 称 为 奇偶 检验 位 ) 被 加 到 预先 
定义 的 位 置 。 奇 偶 校 验 位 的 选择 原则 是 使 码 字 中 1 的 总 数 为 偶数 。 虽 然 有 些 实现 指定 1 的 总 
数 为 奇数 ， 但 我 们 只 讨论 偶数 的 情况 。 


“简单 奇偶 校 验 码 是 单位 的 错误 检测 编码 其 中 ntfs 
第 一 个 编码 ( 表 HH3 ) 是 一 奇偶 校 验 码 ， 其 中 =2，n=3。 表 H-3 中 的 编码 也 是 奇偶 校 


验 码 ， 其 中 本 4， n=5 D 
表 H-3 简单 奇偶 校 验 码 C(5, 4) 
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图 H-6 显示 了 编码 器 (位 于 发 送 者 中 ) 和 译 码 器 (位 于 接收 者 中 ) 的 一 个 可 能 结构 。 





图 H-6 简单 奇偶 校 验 码 的 编码 器 和 译 码 器 


编码 器 使 用 一 个 生成 器 ， 该 生成 器 使 用 4 位 数据 字 的 一 个 副本 (wo，a，a 和 a;)， 生 
成 一 个 奇偶 校 验 位 (ro )。 数 据 字 二 进 制 位 和 奇偶 校 验 位 组 成 了 5 位 的 码 字 。 加 上 的 奇偶 校 
验 位 使 码 字 中 1 的 数目 为 偶数 。 这 通常 是 通过 把 数据 字 的 4 位 加 起 来 ( 模 2 )， 结 果 就 是 奇偶 
校 验 位 ， 换 言 之 : 

ro=43+ayt+ai+ao ( 模 2) 

如 果 1 的 数目 为 偶数 ， 结 果 是 0 ; 如 果 1 的 数目 为 奇数 ,结果 是 1。 在 两 种 情况 下 ， 码 
字 中 1 的 总 数 都 是 偶数 。 

发 送 者 发 送 码 字 ， 该 码 字 在 传输 过 程 中 可 能 会 受到 损坏 。 接 收 者 收 到 一 个 5 位 的 字 ， 接 
收 者 中 的 检查 器 与 发 送 者 中 的 生成 器 做 同样 的 事情 ， 唯 一 不 同 的 是 ， 加 法 是 在 5 位 上 进行 ， 
结果 是 1 位 ， 称 为 纠正 子 。 当 接收 的 码 字 中 1 的 数目 是 偶数 时 ， 纠 正 子 为 0; 否则 为 1。 

so=by+byt+b1+botqo ( 模 2) 

纠正 子 是 检查 过 程 的 输出 ， 它 被 送 到 接收 者 的 决策 逻辑 中 ， 以 决定 对 码 字 中 的 数据 部 分 
如 何 处理 。 决 定 可 以 是 接受 、 丢 弃 或 接受 前 进行 修改 (纠正 编码 )。 在 这 种 情况 下 ， 纠 正 子 
被 传送 给 决策 逻辑 分 析 器 ( decision logic analyzer)。 如 果 码 字 中 没有 错误 ， 纠 正 子 为 0， 决 
策 逻 辑 接受 码 字 中 的 数据 部 分 为 实际 的 数据 字 。 如 果 纠 正 子 为 1， 在 码 字 中 一 定 有 错误 ， 所 
以 决策 逻辑 丢弃 码 字 的 数据 部 分 ， 数 据 字 没有 创建 。 
让 我 们 看 一 些 传输 场景 。 假 定 发 送 者 发 送 的 数据 字 是 1011， 奇 偶 检 验 位 是 
(1+0+1+1) mod 2=1 ， 它 被 加 到 数据 字 的 右边 ， 因 此 ， 从 数据 字 创 建 的 码 字 为 10111， 它 被 发 
送 给 接收 者 。 我 们 检查 下 列 5 种 情况 : 

1 ) 无 错误 发 生 ， 接 收 的 码 字 为 10111， 纠 正 子 是 0， 数 据 字 1011 被 创建 。 

2 ) 发 生 单个 位 错误 ， 改 变 了 a， 接收 的 码 字 为 10011， 纠 正 子 为 1， 数 据 字 没有 创建 。 

3 ) 发 生 单 个 位 错误 ， 改 变 了 奇偶 校 验 位 m， 接 收 的 码 字 为 10110， 纠 正 子 为 1， 数 据 字 
没有 创建 。 注 意 ， 由 于 编码 不 够 复杂 ， 不 能 显示 出 损坏 位 的 位 置 ， 所 以 虽然 数据 字 中 的 位 没 


有 损坏 ， 但 数据 字 还 是 没有 创建 。 
4 ) 一 个 错误 改变 了 ro， 又 一 个 错误 改变 了 了 a3， 接收 的 码 字 为 00110。 纠 正 子 是 0， 数 
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据 字 0011 在 接收 者 中 被 创建 。 注 意 ， 这 里 由 于 纠正 子 的 值 ， 数 据 字 被 错误 地 创建 了 。 简 单 
奇偶 校 验 译 码 器 不 能 检测 出 偶数 个 错误 。 错 误 互 相抵 消 ， 给 出 的 纠正 子 为 0。 

5) 三 位 (a;3，a; 和 ai ) 由 于 错误 发 生 了 改变 ， 接 收 到 的 码 字 为 01011。 纠 正 子 为 1， 数 
据 字 没 有 创建 。 这 表明 简单 奇偶 校 验 能 保证 检测 出 单个 错误 ， 也 能 检测 出任 订 淹 二 和 史 各， 


简单 奇偶 校 验 码 能 检测 出 奇数 个 错误 。 


2. 汉 明 码 
汉 明 码 是 线性 块 编码 的 子 集 ， 遵 循 下 列 两 个 准则 


n=k+r 和 n=2—] 


其 中 上 是 数据 字 中 的 位 数 ，> 是 元 余 位 的 数目 ,是 码 字 中 的 位 数 。 这 种 编码 能 检测 出 
多 达 一 1 位 的 错误 ， 并 能 纠正 多 达 (一 1)/2 位 的 错误 。 
多 一 个 编码 (天 4， 盖 3 和 n=7 ) 满足 汉 明 码 的 两 个 条 件 ， 因 为 有 7=4+3 和 7=2 -1。 
这 种 编码 能 检测 出 3-1=2 位 的 错误 ， 并 能 纠正 (3-1)/2=1 位 的 错误 。 

汉 明 码 的 理论 超出 了 本 书 的 范围 。 更 多 相关 信息 ， 请 参阅 Data Communication and Net- 
working, Behrouz Forouzan, McGraw-Hill, New York, 2006。 下 一 节 讨 论 汉 明码 的 一 个 子 集 ， 


称 为 循环 码 。 


H.4 循环 码 


循环 码 是 具有 额外 特性 的 特殊 线性 块 编码 。 在 循环 码 中 ， 如 果 码 字 被 循环 移 位 (旋转 )， 
则 结果 是 另 一 个 码 字 。 例 如 ， 如 果 1011000 是 一 码 字 ， 我 们 循环 左 移 它 ， 那 么 0110001 也 是 


一 个 码 字 。 


H.4.1 循环 宛 余 校 验 


我 们 可 以 创建 循环 码 来 纠正 错误 。 但 是 ， 所 需要 的 理论 背景 超出 了 本 附录 的 范围 。 这 里 仅 
简单 地 讨论 一 类 称 为 循环 元 余 校 验 (CRC) 的 循环 码 ， 它 用 在 像 LAN 和 WAN 这 样 的 网 络 中 。 
表 H-4 显示 了 一 个 CRC 码 的 例子 。 我 们 可 以 看 到 这 个 编码 的 线性 特性 和 循环 特性 。 


表 H-4 CRC 码 ，k=4， n=7 和 天 3 
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图 H-7 显示 了 编码 器 和 译 码 器 的 一 种 可 能 设计 。 
在 图 H-7 的 编码 器 中 ， 数 据 字 有 人 位 (这 里 是 4)， 码 字 有 位 (这 里 是 7 )。 通 过 在 字 





府 有 录 HH 





的 右边 加 n-k (这 里 是 3 ) 个 0， 数 据 字 的 大 小 扩展 。 这 n 位 结果 被 送 入 生成 器 中 。 生 成 器 使 
用 预先 定义 的 除数 ， 大 小 为 n-k+1 (这 里 是 4 )。 生 成 器 使 用 模 2 除法 把 扩展 的 数据 字 除 以 除 
数 ， 商 被 丢弃 ， 余 数 (mizro ) 被 加 到 数据 字 中 ， 创 建 了 码 字 。 





图 H-7 CRC 编码 器 和 译 码 器 


译 码 器 接收 到 码 字 ， 它 可 能 损坏 ， 所 有 n 位 的 一 个 副本 被 送 入 检查 器 中 ， 检 查 各 是 生成 
器 的 一 个 复制 品 。 检 查 器 产生 的 余数 是 一 个 n-k (这 里 是 3 ) 位 的 纠正 子 ， 它 被 送 入 决策 逻 
辑 分 析 器 中 。 分 析 器 具有 简单 的 功能 : 如 果 纠 正 子 全 为 0， 则 码 字 的 最 左 4 位 被 接受 为 数据 


字 (解释 为 无 错误 )， 否 则 ，4 位 被 丢弃 (错误 )。 


1. 编码 器 


让 我 们 更 仔细 地 看 一 下 编码 器 。 编 码 器 取 数据 字 ， 并 用 n-k 个 0 扩展 它 ， 然 后 把 扩展 的 


数据 字 除 以 除数 ， 如 图 H-8 所 示 。 
注意 ， 这 不 是 常规 的 二 进 制 除法 ， 
模 2 运 算 中 的 二 进 制 除法 ， 在 附录 G 中 讨论 
过 了 。 在 这 种 除法 中 ， 加 法 和 减法 是 相同 的 
(这 是 在 附录 E 中 讨论 的 异 或 运算 )， 这 意味 着 
我 们 不 做 减法 ， 只 做 加 法 。 这 种 除法 的 一 个 
更 好 的 解释 是 把 二 进 制 字 看 成 只 带 有 模 2 运 
算 中 的 0 或 1 系数 的 多 项 式 。 更 多 相关 信息 ， 
我 们 建议 有 兴趣 的 读者 去 参考 有 限 域 理论 
( 伽 罗 瓦 域 ) 以 及 关于 错误 检测 和 纠正 的 书 。 
在 每 一 步 中 ， 除 数 的 一 个 副本 与 被 除数 的 
4 位 进行 异 或 运算 ， 异 或 运算 的 结果 (余数 ) 是 
3 位 (在 这 种 情况 下 )， 在 一 个 额外 的 位 被 移 下 
来 ( 见 图 H-8 ) 形成 4 位 的 长 度 之 后 ， 被 下 一 
步 使 用 。 这 种 类 型 的 除法 中 有 一 个 重点 是 需要 
我 们 记 住 的 ， 如 果 被 除数 (或 每 步 中 使 用 的 部 
分 ) 的 最 左边 一 位 是 0， 商 中 相应 的 位 也 是 0。 


显然 72 除 以 11 的 结果 不 是 商 为 1 0， 余数 为 6。 这 是 
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图 H-8 CRC 编码 器 中 的 除法 
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当 没 有 位 可 以 移 下 来 时 ， 我 们 就 得 出 了 结果 。 三 位 余数 形成 了 校 验 位 (7,, ri 和 ro)。 
它们 被 追加 到 数据 字 上 就 形成 了 码 字 。 同 样 要 注意 的 是 : 我 们 对 商 不 感 兴趣 ， 在 循环 码 中 只 
使 用 余数 。 

2. 译 码 器 

码 字 在 传输 过 程 中 可 能 会 改变 。 译 码 器 做 与 编码 器 相同 的 除法 。 除 法 的 余数 是 纠正 子 。 
如 果 纠 正 子 全 为 0， 这 里 没有 错误 ， 数 据 字 从 接收 到 的 码 字 中 分 离 出 来 ， 并 被 接受 。 否 则 ， 
所 有 的 数据 字 都 丢弃 。 图 H-9 显示 了 两 个 例子 。 左 图 显示 了 无 错误 发 生 时 纠正 子 的 值 ， 纠 正 
子 为 000。 右 图 显示 了 有 1 位 错误 发 生 的 情况 ， 纠 正 子 不 是 全 0 ( 它 是 011 )。 
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图 H-9 两 种 情况 下 CRC 译 码 器 中 的 除法 





3. 除数 
读者 可 能 会 疑惑 除数 1011 是 如 何 选择 的 。 这 需要 抽象 代数 和 有 限 域 理 论 来 解释 ， 请 读 


者 参阅 相关 的 书籍 。 


H.4.2 ”循环 码 的 性 能 


我 们 已 经 看 到 循环 码 在 检测 单位 错误 、 双 位 错误 、 奇 数 个 错误 和 区 间 错 误 方面 具有 很 好 
的 性 能 。 它 们 很 容易 在 硬件 和 软件 上 实现 ， 当 用 硬件 实现 时 ， 其 速度 特别 快 。 这 些 使 得 循环 


码 成 为 许多 网 络 的 良好 选择 。 


H.5 校 验 和 
我 们 讨论 的 最 后 一 种 错误 检测 方法 是 校 验 和 ( checksum )。 校 验 和 被 几 种 协议 在 因特网 
中 使 用 。 像 线性 编码 和 循环 码 一 样 ， 校 验 和 也 是 基于 宛 余 (redundancy) 概念 的 。 


H.5.1 校 验 和 概念 


校 验 和 的 概念 并 不 难 ， 下 面 用 几 个 例子 来 说 明 。 
人 儿 假设 数据 是 5 个 4 位 的 数字 ， 我 们 要 把 它们 送 到 某 个 目的 地 。 除 了 发 送 这 些 数 
据 外 ， 还 发 送 这 些 数字 的 和 。 例 如 ， 如 果 数 字 集 是 (7, 11, 12, 0, 6 )， 发 送 (7, 11, 12, 0， 
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6，36 )， 这 里 36 是 原始 数字 之 和 。 接 收 者 把 5 个 数字 相 加 ， 并 把 结果 与 和 做 比较 ， 如 果 两 
者 相同 ， 接 收 者 假定 无 错误 ， 接 受 这 5 个 数字 ， 丢 弃 和 ; 否则 ， 某 个 地 方 有 错误 发 生 ， 数 据 


则 不 被 接受 。 

如 果 发 送 和 的 负数 ， 称 为 校 验 和 ( checksum)， 这 样 使 得 接收 者 的 工作 更 为 容 
易 。 在 以 上 例子 中 ， 发 送 (7; 11，12，0，6，-36 )。 接 收 者 把 接收 的 数字 全 部 相 加 (包括 
校 验 和 )， 如 果 结 果 为 0， 就 假定 无 错误 ， 否 则 有 错误 。 


H.5.2 求 反 
先前 的 例子 中 有 一 个 重要 的 缺陷 。 除 校 验 和 之 外 ， 数 据 都 是 4 位 的 字 (它们 都 小 于 


15 )， 一 个 解决 方法 就 是 使 用 求 反 运算 (第 3 章 所 讨论 的 )。 
下 面 用 求 反 运算 把 例 H-8 再 做 一 遍 。 图 H-10 显示 了 发 送 者 和 接收 者 的 处 理 过程 。 
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图 H-10 例 H-9 


发 送 者 把 校 验 和 初始 化 为 0， 把 所 有 的 数据 项 和 校 验 和 相 加 (〈 校 验 和 被 看 成 一 个 数据 
项 )， 结 果 是 36， 但 是 36 不 能 用 4 位 表示 。 多 余 的 两 位 被 卷 绕 ， 与 和 相 加 ， 形 成 了 卷 绕 和 ， 
值 为 6。 在 图 中 ， 我 们 显示 了 以 二 进 制 表示 的 细节 。 和 然后 被 求 补 ， 得 到 校 验 和 ， 值 为 9 
(15-6=9 )。 现 在 发 送 者 发 送 6 个 数据 项 给 接收 者 ， 其 中 包括 校 验 和 9。 接 收 者 遵循 与 发 送 者 
相同 的 处 理 过 程 ， 把 所 有 数据 相 加 (包括 校 验 和 )， 结 果 是 45。 和 被 卷 绕 ， 变 成 15， 卷 绕 和 
被 求 补 ， 变 成 了 0。 由 于 校 验 和 的 值 为 0， 意味 着 数据 未 受到 损坏 。 接 收 者 丢弃 校 验 和 ， 保 
存 其 他 的 数据 项 ; 如 果 校 验 和 非 0， 整 个 数据 包 被 丢弃 ， 必 须 再 次 发 送 。 


H.5.3 ”因特网 校 验 和 
通常 ， 因 特 网 (IP 协议 ) 使 用 16 位 校 验 和 。 发 送 者 和 接收 者 使 用 如 下 程序 ; 
1. 发 送 者 一 边 
。 16 位 的 校 验 和 置 为 0， 加 到 信息 上 去 ; 
。 新 的 信息 被 分 成 16 位 的 字 ; 
。 用 反 码 加 法 把 所 有 字 加 起 来 ; 
。 和 被 求 补 ， 蔡 代 原 先 的 校 验 和 。 
2. 接收 者 一 边 
。 把 接收 到 的 信息 (包括 校 验 和 ) 分 成 16 位 的 字 ; 
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。 使 用 反 码 加 法 把 所 有 字 加 起 来 ; 

。 和 被 求 补 ; 

。 如 果 求 补 后 的 和 是 0， 信 息 就 被 接受 ， 否则 ， 被 拒绝 。 

i 计算 一 个 8 个 字符 的 文本 字 (“Forouzan”) 的 校 验 和 ， 如 图 H-11 所 示 。 








a ) 发 送 端 的 校 验 和 
H-11 计算 校 验 和 的 一 个 例子 


文本 需要 划分 成 2 字 节 (16 位 ) 的 字 。 我 们 使 用 ASCII 码 (参见 附录 A) 把 每 个 字 节 
变 成 两 个 十 六 进 制 的 数字 。 例 如 ,，“F” 被 表示 成 (46)is，" o” 被 表示 成 (6F)ie。 在 图 H-11a 
中 ， 第 一 列 的 部 分 和 为 (36)ike， 我 们 保留 最 右边 的 数字 ( 6 )， 把 最 左边 的 数字 ( 3 ) 作为 进位 
插 到 第 二 列 中 。 每 一 列 重 复 这 个 过 程 ， 校 验 和 就 被 计算 出 来 ， 和 数据 一 起 发 送 到 接收 者 。 接 
收 者 进行 同样 的 操作 ， 如 图 H-11b 所 示 。 如 果 有 任何 损坏 ， 接 收 者 重新 计算 的 校 验 和 就 不 是 
全 0。 

3. 性 能 

传统 的 校 验 和 使 用 一 个 小 的 位 数 ( 16 )， 去 检测 任何 大 小 信息 (有 时 是 几 千 位 ) 中 的 错 
误 。 但 是 ， 在 错误 检测 能 力 方面 ， 这 种 方法 没有 CRC 那样 强壮 。 例 如 ， 假 设 一 个 字 的 值 增 
加 了 ， 而 另 一 个 字 的 值 减少 了 相同 的 值 。 因 为 和 与 校 验 和 仍然 是 相同 的 ， 所 以 两 个 错误 就 
不 能 检测 出 来 。 同 样 ， 如 果 几 个 字 的 值 都 增加 了 ， 但 总 共 的 变化 是 65 535 ( 2*-1 ) 的 倍数 ， 
和 与 校 验 和 仍然 是 相同 的 ， 错 误 仍 检测 不 出 来 。 
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Foundations of Computer Science, Fourth Edition 


符号 加 绝对 值 整数 的 加 减法 





在 第 4 章 中 ,我们 展示 了 如 何在 数据 上 进行 运算 。 本 附录 将 会 更 多 地 涉及 和 讨论 符号 加 
绝对 值 整数 的 加 法 和 减法 。 


1.1 整数 的 运算 


用 符号 加 绝对 值 表示 的 整数 的 加 法 和 减法 看 起 来 非常 复杂 。 我 们 有 4 种 不 同 的 符号 组 合 
(两 个 符号 ， 每 个 有 两 个 值 )， 对 于 减法 有 4 种 不 同 的 条 件 。 这 就 意味 着 我 们 要 考虑 8 种 不 同 
的 情况 。 然 而 ， 如 果 我 们 更 详细 地 考察 这 些 符 号 ， 那 么 可 以 归结 成 几 种 情况 ， 如 图 I-1 所 示 。 





图 I-1 符号 加 绝对 值 整数 的 加 法 和 减法 


首先 来 解释 流程 图 : 
1 ) 检查 运算 ， 如 果 运 算是 减法 ， 那 么 改变 第 二 个 整数 (B) 的 符号 。 这 就 意味 着 我 们 现 
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在 只 需 考 虑 两 符号 整数 的 加 法 。 

2 ) 对 两 符号 应 用 XOR 运算 ， 如 果 结 果 (存储 在 临时 单元 S 中 ) 是 0， 则 意味 着 符号 是 
相同 的 (或 者 两 符号 都 是 正 的 ， 或 者 两 符号 都 是 负 的 )。 

3 ) 如 果 符 号 是 相同 的 ， Rr bla 我 们 需要 将 绝对 值 相 加 ， 结 果 的 符号 是 相同 的 
符号 ， 所 以 得 到 ， 

RM=(Aw)+(BM) 和 Rs=As 

这 里 下 标 M 意味 着 绝对 值 ， 下 标 S 意味 着 符号 。 但 是 ， 在 这 种 情况 下 ， 我 们 应 该 仔细 
考虑 上 溢 。 我 们 将 两 个 绝对 值 相 加 时 ， 可 能 会 发 生 上 汶 ， 它 必须 被 报告 ， 处 理 过 程 终止 。 

4) 如 果 符 号 不 同 ，R= 土 (Aw-Bm)， 则 需要 从 Aw 中 减 去 Bw， 然 后 对 符号 进行 判断 ， 不 
是 一 位 接 一 位 地 相 减 ， 而 是 取 第 二 个 绝对 值 (Bw) 的 二 进 制 补 码 ， 将 它们 相 加 。 结 果 的 符号 
是 较 大 绝对 值 整数 的 符号 。 

a, 可 以 证 明 ， 如 果 Am 宇 Bw， 那么 有 上 洲 ， 结果 是 一 个 正 数 。 因此 ， 如 果 有 上 溢 ， 则 使 

弃 上 汶 ， 使 结果 的 符号 取 A 的 符号 。 
b. 可 以 证 明 ， 如 果 Ax<Bw， 那 么 没有 上 汶 ， 结 果 是 一 个 负数 。 因 此 ， 如 果 没 有 上 滋 ， 
则 取 结 果 的 二 进 制 补 码 ， 使 结果 的 符号 取 B 的 符号 。 

和 国有 以 符号 加 绝对 值 格式 存 储 两 整数 A 和 B (为 了 清楚 起 见 ， 我 们 把 符号 与 绝对 值 

分 隅 开 )， 显 示 B 是 如 何 被 加 到 A 上 的 。 
A=(0 0010001)。 B=(0 0010110); 

解 ” 运 算是 相 加 ，B 的 符号 没有 改变 ， 既 然 S=As XOR Bs=0，Rmw=Am+Bm 和 Rs=As， 

那么 这 里 没有 上 溢 。 





符号 没有 上 洲 ] 进位 
A, 外 
B., 一 0 0 ] 0 ] ] 0 Bs 
R OT 0 Ol -J 





用 十 进 制 检验 结果 : (+17) + (+22) = (+39)。 


以 符号 加 绝对 值 格式 存储 两 整数 A 和 B， 显 示 B 是 如 何 被 加 到 A 上 的 。 
=(0 0010001)x B=(1 0010110); 

解 ” 运 算是 相 加 ，B 的 符号 没有 改变 ，S = As XOR Bs = 1，Rw = Am + (Bmw+1)， 既 然 没 
有 上 滋 ， 我 们 需要 取 Rw 的 二 进 制 补 码 ，R 的 符号 是 B 的 符号 。 


符号 没有 上 洲 进位 


A, 0 0 1 0 8 1 
B。 + 1 1 0 1 0 1 0 (B+]) 
1 E320 Pro 





用 十 进 制 检验 结果 : (+17) + (-22)=(-5)。 
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可 时 以 符号 加 绝对 值 格式 存储 两 整数 A 和 B， 显 示 如 何 从 A 中 减 去 B。 
A=(1 1010001), B=(1 0010110); 
解 ”运算 是 相 减 ，SA=Sas，S=As XOR Bs=1]，Rw=Am+(Bmwt+1)， 既 然 有 上 滋 ，Rw 的 值 就 
是 最 终 的 值 ，R 的 符号 是 A 的 符号 。 


有 上 洲 一 | 进位 


A, 1 0 1 0 0 0 1 An 
B, i 
Rs Oath i dn ele Q a ds 1 





用 十 进 制 检验 结果 : (-81)-(-22)=(-59)。 


| 附录 J 


Foundations of Computer Science, Fourth Edition 


实数 的 加 减法 


在 第 4 章 中 , 我 们 展示 了 如 何在 数据 上 进行 运算 。 在 本 附录 中 将 更 多 涉及 有 关 实 数 的 加 
减法 。 


J.1 实数 的 运算 

诸如 加 法 、 减 法 、 乘 法 和 除法 的 所 有 算术 运算 都 可 以 应 用 到 以 浮 点 形式 存储 的 实数 上 。 
两 个 实数 的 乘法 涉及 以 原 码 表示 的 两 个 整数 的 乘法 。 两 个 实数 的 除法 涉及 以 原 码 表示 的 两 个 
整数 的 除法 。 由 于 不 讨论 以 原 码 表示 的 两 个 整数 的 乘法 或 除法 ， 因 此 本 附录 也 不 会 讨论 实数 
的 乘除 法 ， 仅 讨论 实数 的 加 减法 。 

以 浮 点 数 存 储 的 实数 的 加 法 和 减法 被 简化 为 小 数 点 对 齐 后 以 符号 加 绝对 值 格式 (符号 和 
尾数 的 组 合 ) 存储 的 两 整数 的 加 法 和 减法 。 图 J-1 显示 了 处 理 过 程 的 简化 版 本 (有 些 特殊 的 
情况 被 我 们 忽略 了 ) 。 

简化 的 过 程 如 下 : 

1 ) 如 果 两 数 (A 或 B) 中 任 一 个 为 0， 那 令 结 果 为 0， 过 程 终 止 。 

2 ) 如 果 运 算是 减法 ， 那 么 改变 第 二 个 数 (B) 的 符号 来 模拟 加 法 。 

3 ) 通过 在 尾数 中 包含 隐 含 的 1 和 增加 指数 ， 两 个 数 去 规范 化 。 此 时 的 尾数 部 分 看 作 一 


个 整数 。 
4 ) 然后 统一 指数 ， 这 意味 着 我 们 增加 较 小 的 指数 ， 移 位 相应 的 尾数 ， 直 到 两 个 数 具 有 


相同 的 指数 。 例 如 ， 如 果 有 
1.11101X24+1.01X23 


那么 需要 把 两 个 指数 变 成 4: 
1.11101 x 24+0.00101 X24 

5 ) 现在 ， 把 每 个 数 的 符号 和 尾数 的 组 合 看 成 一 个 符号 加 绝对 值 格式 的 整数 。 像 本 章 前 
面 介 绍 的 一 样 ， 将 这 两 个 整数 相 加 。 

6 ) 最 后 ， 再 次 规范 化 数 ， 变 成 1.000010 x 25。 
显示 计算 机 是 如 何 计算 结果 的 : (+5.75) + (+161.875)=(+167.625)。 

解 ”正如 我 们 在 第 3 章 看 到 的 ， 这 两 个 数 以 浮 点 数 格式 存储 ， 如 下 所 示 。 但 是 我 们 需要 
记 住 每 个 数字 有 隐 含 的 1 ( 它 只 是 假设 的 ， 没 有 被 存储 ) 。 注 意 ， 在 这 里 S 代表 符号 , E 代表 





指数 ，M 代表 尾数 。 
S E M 
A 0 10000001 01110000000000000000000 
B 0 10000110 01000011110000000000000 


UML 图 (图 J-1) 中 的 前 几 步 是 不 需要 的 ， 我 们 进行 去 规范 化 ， 给 尾数 增加 隐 含 的 1， 
增加 指数 进行 去 规范 化 。 现 在 两 个 去 规范 化 的 尾数 都 是 24 位 ， 包 含 了 隐 含 的 1。 它 们 应 该 
被 存储 在 有 24 位 的 存储 单元 中 。 每 个 指数 都 被 增加 了 。 
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[减法 ] [加 法 ] 
改变 第 二 个 数 的 符号 
将 两 个 数 去 规范 化 |------ 上 
右 移 尾数 增加 较 小 的 指数 | 循环 
[两 个 指数 相等 ] 
将 符号 和 尾数 的 组 合 相 加 










[上 游 ] 


增加 指数 









图 J-1 浮 点 数 格式 实数 的 加 法 和 减法 


S E 去 规范 化 的 M 
A 0 10000010 101110000000000000000000 
B 0 10000111 101000011110000000000000 


现在 我 们 对 齐 尾数 ， 需 要 增加 第 一 个 指数 ， 右 移 它 的 尾数 。 我 们 把 第 一 个 指数 改 为 
(10000111):， 所 以 需要 把 第 一 个 尾数 右 移 5 位 。 
S E 去 规范 化 的 M 
A 0 10000111 000001011100000000000000 
B 0 10000111 101000011110000000000000 
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现在 进行 符号 加 绝对 值 加 法 ， 把 每 个 数 的 符号 和 尾数 看 成 符号 加 绝对 值 表示 的 整数 。 


S E 去 规范 化 的 M 
R 0 10000111 101001111010000000000000 
在 尾数 中 没有 滋 出 ， 所 以 我 们 规范 化 。 
S E M 
R 0 10000110 01001111010000000000000 


尾数 只 要 23 位 ， 不 需要 四 舍 五 人 。E=(10000110),=134，M=0100111101。 换 言 之 ,， 结 
果 是 (1.0100111101):X22222=(10100111.101)2=167.625。 
显示 计算 机 是 如 何 计算 结果 的 ;，(+5.75) + (-7.023 437 5)=-1.273 437 5。 
解 ” 这 两 个 数 以 浮 点 数 格式 存储 ， 如 下 所 示 。 





S E M 
A 0 10000001 01110000000000000000000 
B l 10000001 11000001100000000000000 
去 规范 化 的 结果 为 : 
S E 去 规范 化 的 M 
A 0 10000010 101110000000000000000000 
B | 10000010 111000001100000000000000 


对 齐 是 不 需要 的 (两 指数 是 相同 的 )， 所 以 我 们 在 符号 和 尾数 的 组 合 上 应 用 加 法 运算 ， 
结果 显示 如 下 (其 中 结果 的 符号 是 负 的 ): 


S E 去 规范 化 的 M 
R | 10000010 001010001100000000000000 
现在 我 们 需要 规范 化 ， 降 低 指数 三 次 ， 左 移 去 规范 化 尾数 三 位 : 
S E M 
R ] 01111111 010001100000000000000000 
尾数 现在 是 24 位 ， 所 以 四 含 五 人 到 23 位 。 
S E M 
R ] 01111111 01000110000000000000000 


结果 是 R=-227 22X(1.0100011)=-1.273 437 5， 正 是 所 期 望 的 。 


缩 略 语 


ADT: Abstract data type， 抽 象 数据 类 型 

AES : Advanced Encryption Standard， 高 级 加 密 
标准 

ALU: Arithmetic logic unit， 算 术 逻 辑 单元 

ANSI : American National Standards Institute， 美 
国 国 家 标准 协会 

ASCII : American Standard code for Information 
Interchange， 美 国信 息 交 换 标准 码 

B-frame: Bidirectional frame， 双 向 帧 

bit: Binary digit， 位 ， 二 进 制 数 

BST:， Binary search tree， 二 叉 搜 索 树 

CA: Certification authority ， 认 证 机 构 

CD-R: Compact disc recordable， 可 刻录 光盘 

CD-ROM: Compact disc read-only memory， 只 读 
光盘 

CD-RW: Compact disc rewritable， 可 重 写 光盘 

CGI: Common Gateway Interface， 通 用 网 关 接 口 

CISC : Complex instruction set computer， 复 杂 指 
令 集 计算 机 

COBOL : Common Business-Oriented Language， 
面向 商业 的 通用 语言 

CPU: Central processing unit， 中 央 处 理 单 元 

DBMS : Database management system， 数 据 库 管 
理 系 统 

DCT: Discrete cosine transform， 离 散 余 弦 变 换 

DES: Data Encryption Standard， 数 据 加 密 标准 

digraph:， Directed graph， 有 向 图 

DMA:; Direct memory access， 直 接 存储 器 存 取 

DRAM: Dynamic RAM， 动 态 随 机 存 取 存储 器 

DVD: Digital versatile disk， 数 字 多 功能 光盘 

EBCDIC : Extended Binary Coded Decimal 
Interchange Code， 扩 展 的 二 进 制 编码 的 十 进 制 
交换 码 

EEPROM : Electronically erasable programmable 
read-only memory， 电 可 擦 除 可 编程 只 读 存 储 器 

EPROM :， Erasable programmable read-only memory, 
可 擦 除 可 编程 只 读 存 储 器 


E-R: Entity-relation， 实 体 - 关系 

FIFO: First-in first-out， 先 进 先 出 

FORTRAN : FORmula TRANslation，Fortran 
语言 

FTP: File Transfer Protocol， 文 件 传 输 协议 

GIF: Graphical Interchange Format， 图 形 交换 格式 

GUI: Graphical user interface， 图 形 用 户 接口 

HTML ，Hypertext Markup Language， 超 文本 标记 
语言 

HTTP : Hypertext Transfer Protocol， 超 文本 传输 
协议 

I-frame: Intracoded frame， 内 部 编码 帧 

IMAP : Internet Mail Access Protocol， 因 特 网 邮 
件 访 问 协议 

IP: Internet Protocol， 网 际 协 议 

ISO: International Organization for Standardization ， 
国际 标准 化 组 织 

ISP: Internet service provider， 因 特 网 服务 提供 商 

JPEG : Joint Photographic Experts Group， 联 合 图 
像 专家 组 

KDC: Key distribution center， 密 钥 分 发 中 心 

LAN; Local area network， 局 域 网 

LIFO: Last-in, first-out， 后 进 先 出 

LZ; Lempel Ziv，LZ 压缩 算法 

LZW: Lempel Ziv Welch，LZW 压缩 算法 

MAC: Media access control， 或 message authenti- 
cation code， 媒 体 访问 控制 或 消息 验 代 码 

MAN: Metropolitan area network， 城 域 网 

MIME : Multipurpose Internet Mail Extension， 多 
用 途 的 因特网 邮件 扩充 协议 

MP3; MPEG audio layer 3，MPEG 第 三 代 音 频 压 
缩 格式 

MPEG:， Motion Pictures Experts Group ， 运 动 图 像 
专家 组 

MS-DOS : Microsoft Disk Operating System， 微 
软磁盘 操作 系统 

MTA : Message transfer agent， 消 息 传送 代理 
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NF: Normal Form， 范 式 

NTFS: NT file system，NT 文件 系统 

P-frame: Predicted frame， 预 测 帧 

POP: Post Office Protocol， 邮 局 协议 

PROM : Programmable read-only memory， 可 编程 
只 读 存 储 器 

RAM: Random access memory， 随 机 存 取 存 储 器 

RDBMS: Relational database management System ， 
关系 数据 库 管 理 系 统 

RGB: Red，green，blue,， 红 ， 绿 ， 蓝 

RISC : Reduced instruction set computer， 精 简 指 
令 集 计 算 机 

ROM: Read-only memory， 只 读 存 储 器 

RSA: Rivest-Shamir-Adelman, RSA 加 密 算法 

SCSI : Small Computer System Interface， 小 型 计 
算 机 系统 接口 

SCTP : Stream Control Transmission Protocol， 流 
控制 传输 协议 


SMTP : Simple Mail Transfer Protocol， 简 单 邮 件 
传输 协议 

SQL: Structured Query Language， 结 构 化 查询 语言 

SRAM: Static RAM， 静 态 随 机 存 取 存 储 器 

TCP: Transmission Control Protocol， 传 输 控制 协议 

TCP/IP : Transmission Control Protocol/Internet 
Protocol， 传 输 控制 协议 / 网 际 协议 

TELNET: Terminal Network， 终 端 网 络 

UDP: User Datagram Protocol， 用 户 数据 报 协议 

UML: Unified Modeling Language， 统 一 建 模 语言 

URL: Uniform Resource Locator， 统 一 资源 定位 符 

USB: Universal serial bus， 通 用 串 行 总 线 

WAN: Wide area network， 广 域 网 

WORM: Write once，read many， 写 一 次 ， 读 多 次 

WWW: World Wide Web， 万 维 网 

XML: Extensible Markup Language， 可 扩展 标记 
语言 

XOR: Exclusive OR， 异 或 


术 语 表 


10-Gigabit Ethernet ( 10Gb 以 太 网 ) 以 10Gb 每 
秒 速率 进行 传输 的 以 太 网 实现 技术 

absolute pathname (绝对 路 径 名 ) 在 UNIX 或 
Linux 系统 中 ， 一 条 从 根 开 始 的 路 径 名 。 

abstract data type (ADT) (抽象 数据 类 型 ) 一 种 
数据 类 型 以 及 定义 在 该 数据 类 型 上 有 意义 的 一 
组 操作 。 

AC value (AC 值 ) 随时 间 变 化 的 值 

access method ( 存 取 方法 ) 从 二 级 (辅助 ) 存 
储 设备 读 取 数据 的 技术 。 

actual parameters (实际 参数 ) 在 函数 调用 语句 
中 的 参数 ， 该 参数 包含 传送 给 函数 的 值 ， 与 形 
式 参 数 相对 应 。 

Ada (Ada 语言 ) 由 美国 国防 部 研制 开发 的 高 级 
并 发 编程 语言 。 

additive cipher (加 法 密码 ) 一 种 密码 类 型 ， 键 
值 定 义 了 一 个 字符 朝 字 母 表 末 端 移动 的 距离 
( 移 位 密码 )。 

additive cipher (加 法 密码 ) 最 简单 的 单字 母 密 
码 ， 每 一 个 密 文字 符 等 于 明文 字符 加 上 键 值 。 

address bus (地 址 总 线 ) 系统 总 线 中 用 于 地 址 
传输 的 部 分 。 

address space (地 址 空间 ) 地 址 的 范围 。 

algorithm (算法 ) 用 计算 机 解决 问题 的 逻辑 步骤 。 

American National Standards Institute ( ANSI ) 
(美国 国家 标准 协会 ) 一 个 负责 创建 编程 语言 、 
电气 规范 、 通 信 协 议 等 标准 的 组 织 。 

American Standard Code for Information 
Interchange ( ASCII) (美国 标准 信息 交换 码 ) 
一 种 用 128 个 数值 来 定义 控制 和 印刷 字符 的 编 
码 方案 。 

ampersand (和 号 ) 在 邮件 地 址 中 使 用 的 符 
号 (@)。 

analog (模拟 量 ) 连续 变化 的 实体 。 

analog data (模拟 数据 ) 连续 且 平 滑 的 数据 ， 不 
受 特定 值 限制 。 

analog signal (模拟 信号 ) 波形 的 一 种 ， 随 时 间 
平滑 变化 。 


analog-to-analog conversion ( 模 模 转换 ) 用 模 
拟 信号 表示 的 模拟 数据 。 

analog-to-digital ( 模 数 转换 ) 用 数字 信号 表示 的 
模拟 数据 。 

analysis phase (分 析 阶 段 ) 软件 系统 生命 周期 的 
一 个 阶段 ， 用 于 和 定义 要 完成 的 既定 目标 的 需求 。 

ancestor (祖先 ) 从 一 个 树 的 当前 节点 到 根 路 径 
上 的 任何 节点 。 

AND operation (与 运算 ) 位 级 别 的 运算 之 一 。 
仅 当 所 有 位 都 是 1 时 ,该 运算 结果 是 1， 否则 
为 0。 

applet (小 程序 ) 一 种 用 Java 语言 编写 的 创建 活 
动 Web 文档 的 计算 机 程序 。 

application gateway (应 用 网 关 ) 在 防火 墙 和 组 
织 电脑 之 间 的 电脑 ， 用 来 过 滤 不 想 要 的 信息 。 

application layer (应 用 层 ) TCP/IP 模 型 的 第 7 
层 ， 提 供 访 问 网 络 服务 。 

application programs (应 用 程序 ) 在 DBMS 术 
语 中 ， 获 取 和 处 理 数据 的 程序 。 

arc ( 弧 ) 图 中 的 定向 线段 。 和 和 边 相 对 。 

arithmetic logic unit ( ALU ) (算术 逻辑 单元 ) 计 
算 机 系统 中 用 于 执行 数据 的 算术 和 逮 辑 运算 的 
部 分 。 

arithmetic operation (算术 运算 ) 取 两 个 数 生成 
另 一 个 数 的 运算 。 

arithmetic operator (算术 运算 符 ) 用 于 算术 运 
算 的 运算 符 。 

arithmetic shift operation (算术 移 位 运算 ) 一 种 
数字 符号 被 保留 的 移 位 运算 。 

array (数组 ) 一 个 大 小 固定 ， 有 序 的 相同 数据 类 
型 的 集合 。 

artificial intelligence (人 工 智 能 ) 模仿 人 类 思维 
的 计算 机 系统 研究 。 

assembler (汇编 程序 ) 将 源 程序 转变 成 可 执行 
对 象 代码 的 系统 软件 ， 传 统 上 和 汇编 语言 程序 
相关 。 参 见 compiler。 

assembly language (汇编 语言 ) 一 种 编程 语言 ， 
其 中 在 计算 机 机 器 语言 和 该 语言 的 符号 指令 集 


之 间 有 一 对 一 的 通信 。 

assignment statement (赋值 语句 ) 将 值 赋 给 变 
基 的 语句 。 

asymmetric-key cipher ( 非 对 称 密 钥 密码 ) 密码 
术 的 一 种 ， 它 使 用 两 个 不 同 的 密 钥 ， 公 钥 用 来 
加 密 ， 私 钥 用 来 解密 。 

asymmetric-key encryption ( 非 对 称 密 钥 密码 学 ) 
用 公 钥 加 密 。 

attribute (属性 ) 在 关系 数据 库 中 ， 一 个 关系 中 的 
每 一 列 。 

attribute (属性 ) 在 关系 数据 库 术 语 中 ， 列 表 头 的 
名 字 。 

audio (音频 ) 声音 或 音乐 的 记录 或 传输 。 

authentication (验证 ， 认 证 ) 消息 发 送 者 的 身 
份 验证 。 

autokey cipher 一 种 密码 ， 键 在 加 密 的 过 程 中 
从 明文 密码 中 产生 。 

auxiliary storage (辅助 存储 设备 ) 主 存储 器 以 
外 的 任何 存储 设备 ; 永久 数据 存储 设备 ; 外 存 
储 器 ; 二 级 存储 器 。 

availabiiity (可 用 性 ) 信息 安全 的 构件 ， 它 要 求 
组 织 创建 和 存储 的 信息 对 授权 实体 是 可 用 的 。 

axon( 轴 突 ) 人 体 神 经 的 一 部 分 ， 它 通过 神经 键 
向 其 他 神经 提供 输出 。 

base ( 基 ) 在 数字 系统 中 使 用 的 数字 的 数量 。 二 
进 制 的 基 为 2， 八 进 制 的 基 为 8， 十 进 制 的 基 
为 10， 十 六 进 制 的 基 为 16。 

basis path testing (基本 路 径 测 试 ) 白 盒 测试 法 ， 
创建 一 套 测 试用 例 ， 执 行 软 件 中 的 每 条 语句 至 
少 一 次 。 

batch operating system ( 批 处 理 操作 系统 ) 早 
期 计算 机 使 用 的 操作 系统 ， 其 任务 在 被 服务 之 
前 是 分 组 的 。 

bidirectional frame ( B-frame) (双向 帧 ) 用 于 表 
示 在 MPEG 中 和 前 后 帧 相关 的 帧 。 

big-O notation (大 O 表示 法 ) 一 种 算法 效率 的 
测量 ， 这 种 方法 仅 考 虑 主导 因素 。 

binary digit (bit)( 二 进 制 数 ) 信息 的 最 小 单元 (0 
或 1 )。 

binary file (二 进 制 文件 ) 以 计算 机 内 部 格式 存储 
的 数据 集合 。 相 对 于 文本 文件 。 

binary operation (二 元 操作 ) 需要 两 个 输入 操作 
数 的 操作 。 

binary search ( 折 半 查找 ) 一 种 查找 算法 ， 通 过 
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重复 将 列表 对 半 划 分 查找 来 定位 数值 。 

binary search tree (BST)( 二 叉 搜 索 树 ) 一 模 二 
叉 树 ， 其 左 子 树 中 的 关键 字 值 都 小 于 根 的 关键 
字 值 ， 右 子 树 中 的 关键 字 值 都 大 于 或 等 于 根 的 
关键 字 值 ， 而 且 每 棵 子 树 也 是 二 又 搜索 树 。 

binary system (二 进 制 系统 ) 使 用 0 和 和 1 两 种 符 
号 的 编号 系统 。 

binary tree (二 叉 树 ) 该 树 中 任 一 节点 要 么 没 
有 子 节点 ， 要 么 有 一 个 子 节点 ， 要 么 有 两 个 子 
节点 。 

bit( 位 ) 二 进 制 数字 的 首 字母 缩写 。 在 计算 机 中 ， 
值 为 0 或 1 的 基本 存储 单位 。 

bit depth (位 深度 ) 在 样本 过 程 中 表示 样本 的 位 
的 数目 。 

bit pattern (位 模式 ) 0 和 1 组 成 的 位 序列 。 

bit rate (比特 率 ) 每 秒 钟 传输 的 位 的 数目 。 

bitmap graphic (位 图 图 像 ) 用 像素 定义 图 形 的 
图 像 表示 法 。 

black-box testing ( 黑 盒 测试 ) 基于 系统 需求 而 


不 是 基于 程序 知识 的 测试 。 
block cipher ( 块 密码 ) 一 种 密码 ， 每 一 次 一 组 
字符 被 加 密 或 解密 。 


Bluetooth (蓝牙 ) 一 种 无 线 技术 ， 被 设计 以 在 小 
型 区 域 进行 设备 的 连接 。 

Boolean algebra (布尔 代数 ) 操纵 只 有 真 、 假 
值 的 对 象 (布尔 对 象 ) 的 代数 。 

bootstrap ( 自 举 ) 当 计算 机 开机 时 ， 把 操纵 系统 
装载 到 主 内 存 的 过 程 。 

breadth-first traversal (广度 优先 遍历 ) 一 种 图 
的 遍历 方法 ， 在 该 方法 中 当前 处 理 节点 的 邻 节 
点 的 处 理 要 优先 于 其 子 节点 。 

browser (浏览 器 ) 显示 万 维 网 文件 (网 页 ) 的 应 
用 程序 。 

brute-force search ( 亦 力 搜索 ) 一 种 检查 树 中 每 
条 路 径 ， 直 至 发 现 目标 的 查找 方法 。 

bubble sort ( 冒 泡 排 序 ) 一 种 排序 算法 ， 算 法 每 
轮 将 最 小 的 数 移动 至 未 排序 部 分 的 首位 。 

bucket ( 桶 ) 在 散 列 算 法 中 ， 一 种 可 用 于 放置 多 
个 数据 单元 的 特定 区 域 。 

bucket hashing ( 桶 散 列 法 ) 一 种 使 用 桶 减少 冲 
突 的 散 列 算法 。 

bus (总 线 ) 计算 机 中 连接 不 同 硬件 部 分 的 物理 
通道 ; 通过 总 线 拓扑 结构 使 用 共享 的 物理 介质 。 

byte ( 字 节 ) 一 种 存储 单位 ， 通 常 为 8 位 。 
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bytecode ( 字 节 码 ) 一 种 机 器 语言 ， 在 其 中 Java 
源 程 序 被 编译 。 

C language (C 语言 ) 一 种 由 Dennis Ritchie 开 
发 的 过 程 化 编程 语言 。 

C++ language (C++ 语言 ) 由 Bjarne Stroustrup 
开发 的 面向 对 象 的 编程 语言 。 

cache memory (高 速 缓冲 存储 器 ) 用 于 保存 当 
前 正在 处 理 的 数据 项 的 小 型 快速 存储 器 。 

Caesar cipher ( 恺 撒 密 码 ) 由 尤 利 乌 斯 恺 撤 
使 用 的 移 位 密码 。 

cardinality (基数 ) 在 关系 型 数据 库 中 ， 每 一 个 
关系 的 行 的 总 量 。 

central processing unit ( CPU ) (中 央 处 理 单元 ) 
计算 机 中 包含 的 用 于 解释 指令 的 控制 部 件 ， 在 
个 人 计算 机 中 则 是 指 一 个 包含 控制 单元 和 算术 
逻辑 单元 的 微 处 理 器 。 

certification authority (CA) (认证 机 构 ) 把 公 乌 
和 实体 捆绑 在 一 起 ， 且 解决 身份 验证 的 组 织 。 

challenge-response authentication (质询 - 响应 
身份 验证 ) 要 求 者 证 实 她 在 没有 发 送 秘密 前 
知晓 秘密 的 过 程 。 

child ( 子 节点 ) 在 树 或 图 中 拥有 祖先 的 节点 。 

Church-Turing thesis ( 苑 奇 - 图 灵 论 题 ) 在 计 
算 理 论 中 ， 一 个 关于 使 用 递归 (于 奇 理论 ) 和 
机 械 设备 的 可 计算 函数 的 本 质 等 价 于 一 台 图 灵 
机 的 复合 假设 。 

cipher (密码 ) 一 种 加 密 解 密 算法 。 

ciphertext ( 密 文 ) 加 密 数 据 。 

circular shift operation (循环 移 位 运算 ) 一 种 把 
从 二 进 制 字 一 端 移 出 的 位 插入 字 的 另 一 端的 移 
位 运算 。 

circular waiting (循环 等 待 ) 在 操作 系统 中 ， 所 
有 涉及 的 进程 和 资源 形成 了 一 个 循环 。 这 种 情 
景 称 为 循环 等 待 。 

class( 类 ) 一 种 将 数据 和 函数 结合 在 一 起 的 类 型 。 

client diagram (类 图 ) 在 一 个 系统 中 表明 类 之 
间 关 系 的 图 。 

class-server paradigm (客户 机 一 服务 器 范式 ) 一 
种 范式 ， 由 同一 个 网 络 连接 的 两 个 电脑 : 一 台 
提供 服务 ， 另 一 台 请 求 服务 。 

coaxial cable ( 同 轴 电 缆 ) 一 个 由 导体 截止 制 成 
的 电缆 以 及 一 个 作为 第 二 导体 的 外 壳 。 

code (代码 ) 设计 成 表示 文本 符号 的 一 组 位 模式 


人 
中 oo 


code generator (代码 生成 器 ) 在 编译 程序 或 解 
释 程序 中 生成 机 器 语言 代码 的 程序 。 

cohesion (内 聚 ) 模块 的 一 种 属性 ， 该 属性 用 于 
描述 一 个 过 程 内 部 各 个 模块 之 间 的 相关 程度 。 

collision (冲突 ) 在 散 列 中 ， 当 散 列 算法 为 一 个 
关键 字 提 供 的 地 址 已 经 被 占有 的 事件 。 

collision resolution (冲突 解决 法 ) 一 种 用 于 解 
决 散 列 算法 中 产生 冲突 事件 后 生成 其 他 地 址 的 
算法 。 

color depth (颜色 深度 ) 用 来 表示 像素 颜色 的 位 数 。 

column-major storage (以 列 为 主 序 的 存储 ) 一 
种 二 维 数 组 的 存储 方法 ， 数 组 中 的 元 素 是 一 列 
接 一 列 存放 的 。 

common business-oriented language (COBOL) 
(面向 商业 的 通用 语言 ) 由 Grace Hopper 开发 
的 一 种 商业 编程 语言 。 

compact disc ( CD) (光盘 ) 直接 访问 的 光 存 储 
介质 。 

compact disc read-only memory (CD-ROM) (只 
读 光 条 存储器 ) 一 种 数据 由 制造 商 写 人 而 用 户 
只 能 读 取 的 光盘 。 

compact disc recordable (CD-R) (可 刻录 光盘 ) 由 
用 户 写 一 次 读 多 次 的 光盘 。 

compact disc rewritable (CD-RW) (可 重 写 光 我 ) 
可 由 用 户 多 次 读 写 的 光盘 。 

compilation (编译 ) 在 执行 程序 之 前 ， 将 用 高 
级 语言 所 编写 的 全 部 源 程 序 翻译 成 机 器 语言 的 
过 程 。 

compiler (编译 器 ) 一 种 将 源 程序 转变 为 可 执行 
代码 的 系统 软件 ， 通 常 与 高 层 语言 相关 联 。 参 
见 assembler。 

complex instruction set computer ( CISC) (复杂 
指令 集 计 算 机 ) 一 种 定义 了 复杂 的 指令 系统 的 
计算 机 ， 虽 然 其 中 的 一 些 指令 并 不 经 常用 到 。 

composite type (复合 数据 类 型 ) 由 两 种 或 两 种 
以 上 简单 数据 类 型 组 成 的 一 种 数据 类 型 。 

compound statement (复合 语句 ) 在 一 些 编程 
语言 中 ， 多 个 语句 (指令 ) 集合 被 当成 为 一 条 
指令 来 处 理 。 

computer language (计算 机 语言 ) 任何 一 种 依照 
句法 的 可 用 来 编写 计算 机 程序 的 语言 ， 例 如 ， 机 
器 语言 、 汇 编 语 言 、C、COBOL 和 FORTRAN。 

conceptual level (概念 层 ) 涉及 数据 库 的 逻辑 
结构 。 它 只 与 数据 库 的 意义 有 关 ， 而 与 它 的 物 


理 实 现 有 关 。 
confidentiality (机 密 性 ) 一 个 安全 目标 ， 用 于 定 
义 对 非 授权 实体 隐藏 信息 的 过 程 。 


connecting device (连接 设备 ) 连接 计算 机 或 网 


络 的 设备 。 
connectionless protocol (无 连接 协议 ) 一 种 无 


须 建立 连接 或 终止 连接 的 数据 传输 协议 。 

constant (常量 ) 在 程序 运行 中 值 不 能 被 改变 的 
数据 值 ， 与 变量 相对 。 

control bus (控制 总 线 ) 在 计算 机 各 组 件 间 传递 
信息 的 总 线 。 

control statement (控制 语句 ) 一 种 在 源 程 序 中 
改变 控制 顺序 流 的 语句 。 


control structure testing (控制 结构 测试 ) 一 种 
白 盒 测 试 方法 ， 使 用 不 同 的 测试 种 类 : 条 件 测 
试 、 数 据 流 测试 和 循环 测试 。 

control unit (控制 单元 ) CPU 中 能 够 解释 指令 和 
控制 数据 溢出 的 组 件 。 

controller (控制 器 ) 在 图 灵机 中 有 着 类 似 于 计算 
机 的 CPU 作用 的 组 件 。 

copyright (版 权 ) 写 或 创作 作品 的 权利 。 

country domain (国家 域名 ) 域名 系统 的 子 域 ， 
使 用 两 个 字符 (代表 国家 ) 作为 后 级 。 

coupling (耦合 ) 两 个 独立 函数 之 间 相 互 依赖 性 
的 一 种 度量 。 

cryptographic hash function (加 密 的 散 列 函数 ) 
一 种 由 信息 生成 信息 摘要 的 函数 。 

cryptography (密码 学 ) 一 门 通过 信息 转换 保证 
信息 机 密 和 免 受 攻击 的 科学 和 艺术 。 

current directory (当前 目录 ) 在 UNIX 和 Linux 
系统 中 ， 用 户 当 前 所 在 的 目录 。 

cycle ( 环 路 ) 起 点 和 终点 为 同一 项 点， 长 度 大 于 
1 的 图 的 路 径 。 

data bus (数据 总 线 ) 计算 机 内 用 来 在 部 件 间 传 
递 数据 的 总 线 。 

data compression (数据 压缩 ) 在 不 损失 有 意义 
的 信息 的 情况 下 压缩 数据 量 。 

data confidentiality (数据 机 密 性 ) 一 种 安全 服 
务 ， 用 来 保护 数据 ， 防 止 泄露 攻击 、 嗅 探 和 流 
量 分 析 。 

data file (数据 文件 ) 只 存放 数据 不 存放 程序 的 
文件 。 

data flow diagram (数据 流程 图 ) 一 种 显示 系统 
中 数据 流动 的 图 。 
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data integrity (数据 完整 性 ) 一 种 安全 服务 ， 用 
来 保护 数据 ， 防 止 修改 、 插 人 和 人、 删除 和 重 放 。 
data link layer address (数据 链 路 层 地 址 ) 用 在 
数据 链 路 层 的 地 址 ， 有 时 称 为 MAC 地址， 有 
时 称 为 物理 地 址 。 

data processor (数据 处 理 器 ) 用 来 输入 、 处 理 
数据 并 输出 结果 的 实体 。 

data structure (数据 结构 ) 符合 一 定 句 法 的 数据 
表示 形式 ， 这 种 数据 组 织 形式 可 以 显示 个 体 元 
素 之 间 的 关系 。 

data type (数据 类 型 ) 一 组 命名 的 数值 集合 以 及 
用 于 控制 它们 的 操作 ， 如 字符 型 和 整 型 。 

data-link layer TCP/IP 协议 的 第 二 层 。 

database (数据 库 ) 有 组 织 的 信息 的 一 个 集合 。 

database management system ( DBMS)( 数 据 库 
管理 系统 ) 处 理 数据 库 的 一 个 或 一 套 程序 。 

database model (数据 库 模 型 ) 定义 数据 逻辑 设 
计 的 一 种 模型 。 

datagram (数据 报 ) 由 IP 协议 传送 的 包 。 

DC value (DC 值 ) 不 随时 间 变 化 的 值 。 

deadlock ( 死 锁 ) 一 个 任务 的 资源 被 其 他 任务 占 
有 而 导致 不 能 完成 的 状态 。 

decimal digit (十 进 制 数 ) 十 进 制 系统 中 的 符号 。 

decimal system (十 进 制 系统 ) 使 用 10 个 符号 
(0 一 9 ) 表述 数字 的 方法 。 

decision (决策 ) 在 编程 中 的 双向 路 径 ， 其 中 一 
个 应 该 被 程序 选择 。 

declarative language (声明 性 语言 ) 利用 逻辑 
推理 原则 来 解答 查询 的 一 种 计算 机 语言 。 

declarative paradigm (声明 式 范 式 ) 利用 逻辑 
推理 原则 来 解答 查询 的 范式 。 

decrement statement (递减 语句 ) 使 变量 的 值 
减 1 的 语句 。 

decryption (解密 ) 将 原始 消息 从 加 密 数 据 中 恢 
复 。 参 见 encryption。 

decryption algorithm (解密 算法 ) 将 加 密 信 息 解 
密 成 明文 的 算法 。 

default logic ( 缺 省 逻辑 ) 在 这 种 逻辑 中 ， 当 参 
数 的 缺 省 结论 与 知识 库 中 的 内 容 一 致 时 ， 则 参 
数 的 缺 省 结论 被 接受 。 

deleteoperation (删除 操作 ) 根据 指令 所 给 标准 
删除 一 个 元 组 的 操作 。 

delete operation (删除 操作 ) 在 关系 数据 库 中 ， 
此 操作 删除 关系 中 的 元 组 。 
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demand paging (请求 分 页 调度 ) 一 种 当 程序 的 
某 页 仅 在 需要 时 才 载 人 内 存 的 内 存 分 配方 法 。 
demand paging and segmentation (请 求 分 页 和 
分 段 调度 ) 一 种 当 程序 的 某 页 或 某 段 仅 在 需 
要 时 才 被 载 人 内 存 的 内 存 分 配方 法 。 

demand segmentation (请求 分 段 调度 ) 一 种 当 
程序 的 某 段 仅 在 需要 时 才 被 载 人 内 存 的 内 存 分 


配方 法 。 

demodulator ( 解 调 器 ) 将 信号 转化 为 数据 的 
设备 。 

dendrite ( 树 状 曲 体 ) 神经 元 中 起 到 输入 设备 作 
用 的 那 部 分 。 


denial of service (拒绝 服务 ) 对 安全 可 用 目标 
的 唯一 攻击 ， 可 能 引起 系统 运行 变 缓 或 系统 
中 断 。 

depth-first traversal (深度 优先 遍历 ) 在 访问 
相 邻 节点 之 前 遍历 本 节点 所 有 的 子孙 的 遍历 
方法 。 

dequeue (出 队 ) 在 队列 中 删除 一 个 元 素 。 

descendant (子孙 ) 当前 节点 通 向 叶子 路 径 上 的 
任 一 节点 。 

design phase (设计 阶段 ) 软件 生命 周期 中 定义 
如 何 实现 在 分 析 阶 段 中 提出 的 目标 的 阶段 。 

development process (开发 过 程 ) 创建 系统 生 
命 周期 之 外 的 软件 的 过 程 。 

device manager (设备 管理 器 ) 操作 系统 中 用 来 
管理 输入 / 输出 设备 的 组 件 。 

dictionary-based encoding (基于 字典 的 编码 ) 
一 种 压缩 方法 ， 在 这 一 过 程 中 创建 一 个 字典 。 

difference operation ( 差 运 算 ) 两 个 集合 之 间 的 
运算 。 结 果 为 第 一 个 集合 减 去 两 个 集合 中 的 公 
共 元 素 ， 或 者 关系 数据 库 中 的 操作 符 ， 这 个 操 
作 符 应 用 于 两 个 有 着 相同 属性 的 关系 。 结 果 关 
系 中 的 值 是 存在 于 第 一 个 关系 而 不 存在 于 第 二 
个 关系 中 的 值 组 。 

digest (摘要 ) 一 个 信息 的 压缩 映像 。 

digit extraction hashing (数字 析 取 散 列 ) 将 选 
中 数字 从 键 中 析 取 并 将 它们 用 作 地 址 的 过 程 。 

digit extraction method (数字 析 取 方法 ) 使 用 
数字 析 取 的 散 列 方法 。 

digital (数字 的 ) 离散 ( 非 连续 的 ) 的 实体 。 

Digital data (数字 数据 ) 有 离散 值 表 示 的 数据 。 

digital signal (数字 标志 ) 使 用 许多 离散 值 表 示 
的 信号 。 


digital signature (数字 签名 ) 用 于 鉴别 消息 发 送 
者 并 保护 数据 完整 性 的 一 种 方法 。 

digital subscriber line ( DSL) 一 种 支持 在 已 知 
电话 线 上 高 速 交 流 的 技术 。 

digital versatile disk ( DVD) (数字 多 功能 光盘 ) 
一 种 直接 访问 的 光 存 储 介 质 。 

digital-to-analog conversion ( 数 模 转换 ) 使 用 
模拟 信和 号 表示 数字 的 方法 。 

digital-to-digital conversion ( 数 数 转换 ) 用 数字 
信号 表示 数字 的 方法 。 

digraph (有 向 图 ) 一 种 有 方向 的 图 。 

direct hashing (直接 散 列 法 ) 一 种 无 须 算法 上 
的 修改 就 可 获得 键 值 的 散 列 方法 。 

direct memory access (DMA) (直接 存储 器 存 取 ) 
一 种 输入 /输出 形式 ， 通 过 特殊 的 设备 控制 内 
存 和 1/O 设备 间 的 数据 交换 。 

directed graph (有 向 图 ) 在 线 ( 弧 ) 上 标明 方向 
的 图 。 

directory (目录 ) 包含 文件 名 和 其 他 文件 地 址 的 
文件 。 

discrete cosine transformation (DCT) (离散 余弦 
变换 ) 用 于 JPEG 的 数学 变换 。 

distributed database (分 布 式 数 据 库 ) 一 种 数据 
库 ， 它 的 数据 分 别 存储 在 多 台 计 算 机 上 。 

distributed system (分 布 式 系统 ) 控制 的 资源 分 
布 在 不 同 站 点 的 计算 机 上 的 操作 系统 。 

division remainder method ( 除 余 法 ) 一 种 散 列 
类 型 ， 它 的 键 值 除 以 一 个 数 且 余数 用 作 地 址 。 

domain name (域名 ) 在 DNS (域名 服务 器 ) 中 ， 
用 点 分 隔 的 符号 序列 。 

Domain Name Server (DNS) (域名 服务 器 ) 一 
台 持 有 互联 网 域名 信息 的 计算 机 。 

doman name space ( 杜 曼 名 字 空 间 ) 组 织 名 了 字 
空间 的 一 种 方法 ， 在 根 节点 在 顶部 的 倒置 树 结 
构 中 定义 名 字 。 

dotted-decimal notation ( 带 点 的 十 进 制 标记 法 ) 
为 使 IP 地 址 易 读 而 设计 的 一 种 标记 法 ; 每 一 
字 节 转换 为 十 进 制 数 ， 数 字 通过 点 分 隔 开 。 

DSL 数字 用 户 线路 。 

dynamic RAM (DRAM) (动态 RAM) 其 单元 使 
用 电容 器 的 RAM，DRAM 必须 周期 性 地 刷新 
以 保持 其 数据 。 

edge ( 边 ) 没有 方向 的 图 的 连 线 。 

edge detection (边缘 检测 ) 一 种 查找 图 像 边 缘 
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的 图 像 处 理 方法 ， 通 过 颜色 上 和 文字 上 的 变化 
来 审视 图 像 区 域 。 

electrically erasable programmable read-only 
memory (EEPROM) ( 电 可 擦 除 可 编程 只 读 存 
储 器 ) 可 编程 的 只 读 存储 器 ， 它 可 以 使 用 电 
脉冲 编程 和 擦 除 ， 操 作 时 不 需要 从 计算 机 中 
移出 。 

electronic mail (email) (电子 邮件 ) 不 同 于 主机 
对 主机 交换 方式 ， 而 是 基于 邮箱 地 址 的 一 种 发 
送 电 子 消息 的 方法 。 

emacs Unix 的 一 种 文本 编辑 器 。 

encryption (加 密 ) 将 信息 转 成 只 有 通过 解密 才 
可 读 懂 的 格式 。 

encryption algorithm (加 密 算法 ) 一 种 将 明文 信 
息 加 密 的 算法 。 

end system (终端 系统 ) 数据 的 发 送 方 或 接收 方 。 

end users (终端 用 户 ) 在 DBMS 术语 中 ， 直 接 
访问 数据 库 的 用 户 。 

enqueue (人 队 ) 将 一 个 元 素 插 入 一 个 队列 。 

entity authentication (实体 身份 验证 ) 使 得 一 部 
分 能 证 明 男 一 部 分 标识 的 一 种 技术 。 

entity-relation ( E-R) model (实体 关系 模型 ) 在 
关系 数据 库 中 定义 实体 和 实体 间 关 系 的 一 种 
模型 。 

entity-relationship ( E-R) diagram (实体 关系 图 ) 
基于 实体 -关系 模型 的 图 。 

ephemeral port number (临时 端口 号 ) 客户 端 
使 用 的 端口 号 。 

erasable programmable read-only memory 
( EPROM) (可 擦 除 可 编程 只 读 存 储 器 ) 可 以 
多 次 擦 除 和 重 写 的 只 读 存 储 器 ， 擦 除 EPROM 
时 需要 从 计算 机 中 移出 。 

error report file (错误 报告 文件 ) 在 文件 更 新 过 
程 中 ， 更 新 期 间 检测 到 错误 的 报告 。 

_ethical principle (道德 准则 ) 当 使 用 计算 机 时 ， 
一 种 评判 我 们 对 世界 上 其 他 人 的 责任 的 方式 是 
基于 我 们 对 于 道德 的 决策 。 

Excess representation ( 余 码 表示 法 ) 一 种 数字 
表示 方法 ， 用 于 存储 分 数 的 指数 值 。 

Excess_1023 ( 余 1023 码 ) 表示 浮 点 数 的 高 精度 
的 IEEE 标准 。 

Excess_127 ( 余 127 码 ) 表示 浮 点 数 的 低 精度 的 
IEEE 标准 。 

execute (执行 ) 通过 控制 单元 向 计算 机 的 不 同 


部 分 发 送 命令 。 

expert system (专家 系统 ) 一 种 系统 ， 该 系统 
使 用 知识 表示 去 完成 通常 需要 人 类 专家 经 验 的 
任务 。 

expression (表达 式 ) 一 个 换算 成 单一 值 的 操作 
数 和 操作 符 的 序列 。 

expression tree (表达 式 树 ) 一 种 倒置 树 ， 根 和 
节点 是 操作 符 ， 叶 子 节点 是 操作 数 。 

external level (外 层 ) 数据 库 与 用 户 交 互 的 那 
部 分 。 

Facebook 一 个 拥有 超过 十 亿 用 户 的 社交 网 络 
网 站 。 

fetch ( 取 (指令 )) 指令 周期 中 从 内 存 中 取出 用 
来 执行 的 部 分 。 

fiber-optic cable (光纤 电费 ) 以 脉冲 形式 承载 信 
号 的 截止 。 它 包含 一 根 由 玻璃 或 塑料 制 成 的 细 
柱 ( 核 )， 外面 套 有 其 他 的 由 玻璃 或 塑料 制 成 的 
圆柱 ( 包 层 )。 

field (字段 ) 数据 的 最 小 命名 单位 ， 该 数据 在 描 
述 信息 方面 有 含义 。 一 个 字段 可 能 是 一 个 变量 
也 可 能 是 一 个 常量 。 

file transfer protocol ( FTP) (文件 传输 协议 ) 一 
种 TCP/IP 应 用 层 服务 ， 用 来 与 远程 站 点 间 的 
文件 传输 。 

finite state automation (有 限 状态 自动 机 ) 预定 
义 几 种 状态 的 机 器 。 

firewall (防火 墙 ) 一 种 安装 在 组 织 的 内 部 网 络 和 
网 络 中 其 他 部 分 的 设备 ， 用 于 提供 安全 。 

FireWire (火线 ) 一 种 输入 /输出 设备 控制 器 ， 
带 有 可 传输 打包 数据 的 高 速 串 行 接口 。 

first in ，first out (FIFO) (先进 先 出 ) 列表 中 先 
添加 的 数据 项 先 移出 的 算法 。 

flat-file (平面 文件 ) 组 织 中 不 依赖 于 其 他 文件 的 
独立 文件 。 

floating-point representation ( 浮 点 表示 法 ) 计 
算 机 中 的 一 种 数字 表示 法 ， 为 得 到 更 高 的 精 
度 ， 小 数 点 的 位 置 是 浮动 的 ， 常 用 来 表示 计算 
机 中 的 实数 。 

follow (跟随 ) 在 Twitter 上 如 何 连接 其 他 用 户 。 

following (跟随 ) 在 Twitter 上 的 多 对 一 关系 ， 
多 个 用 户 跟随 一 个 用 户 。 

following (跟随 ) 跟随 你 所 知道 的 人 以 在 自己 的 
主页 上 查看 他 们 的 推 文 。 

formal parameters (形式 参数 ) 在 函数 中 声明 的 
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参数 ， 用 于 描述 传 给 该 函数 的 数据 的 类 型 。 

FORmula TRANslation (FORTRAN) 用 于 科学 
和 工程 应 用 中 的 一 种 面向 过 程 的 高 级 语言 。 

fragmented distributed database (不 完全 分 布 
式 数据 库 ) 一 种 数据 本 地 化 的 分 布 式 数据 库 。 

frame ( 帧 ) 数据 链 路 层 中 的 数据 单元 。 

frames (框架 ) 知识 表示 中 的 一 种 类 似 于 语义 网 
的 表示 方法 。 

frequency masking (频率 掩蔽 ) 频率 完全 掩蔽 
其 他 频率 的 过 程 。 

friend (朋友) 在 Facebook 上 ， 一 个 用 户 可 以 收 到 
其 他 用 户 的 帖子 。 

friendship (友谊 ) 在 Facebook 中 用 户 之 间 的 一 
对 一 关系 。 

friendship (友谊 ) 在 Facebook 上 ， 只 有 朋友 之 
间 才 可 以 分 享 。 友 谊 是 一 对 一 的 相互 关系 。 

front (前 端 ) 在 使 用 出 队列 操作 进行 删除 的 队列 
中 的 下 一 个 元 素 。 

function (函数 ) 在 阻 数 范式 中 ， 将 一 组 输入 映 
射 到 一 组 输出 的 黑 盒 子 。 

functional language (函数 型 语言 ) 一 种 程序 语 
言 ， 它 认为 程序 是 一 种 数学 函数 。 

functional paradigm (函数 范式 ) 一 种 范式 ， 在 
其 中 程序 被 看 成 数学 函数 。 

general linear list (广义 线性 表 ) 一 个 可 以 在 任 
意 位 置 插入 或 删除 数据 的 表 。 

generic domain (通用 域 ) 域名 名 字 空 间 的 一 个 
子 空间 ， 使 用 通用 后 级 。 

Gigabit Ethernet ( 吉 比 特 以 太 网 ) 有 着 吉 比 特 
( 1000Mbps) 数据 速率 的 以 太 网 。 

glass-box testing (玻璃 盒 测试 ) 参见 white-box 
testing。 

Gidel number (歌德 尔 数 ) 赋值 给 每 个 程序 使 
用 的 数字 ， 可 以 在 具体 的 语言 中 编写 。 

graph (图 ) 称 为 顶点 的 节点 、 称 为 边 或 弧 的 线 
段 以 及 节点 连接 对 的 集合 。 

graphic interchange format ( GIF) (图 像 交换 格 
式 ) 一 个 每 个 像素 点 用 8 位 来 表示 的 位 图 
图 像 。 

graphical user interface (GUI) (图 形 用 户 界面 ) 
一 种 定义 了 图 标 和 图 标 上 操作 的 用 户 界 面 。 

Guided media (导向 介质 ) 电线 

hacker (黑客 ) 精明 的 计算 机 专家 ， 可 能 会 对 他 
人 造成 损害 。 


halting problem (停机 问题 ) 编写 一 段 程序 测试 
用 歌德 尔 数 表示 的 任何 程序 是 否 会 终止 。 

hardware (硬件 ) 计算 机 系统 中 的 物理 设备 ， 如 
键盘 或 打印 机 。 

hardware abstraction layer ( HAL ) (硬件 抽象 层 ) 
Windows 系统 中 最 底层 的 程序 ， 隐 藏 了 来 自 上 
层 的 不 同 。 

hashed file( 散 列 文件 ) 使 用 某 一 散 列 算法 进行 
查找 的 文件 。 

hashed MAC ( HMAC) 来 自 ITU 的 推荐 ， 描 
述 了 公 和 钥 分 发 的 证 书 ， 这 个 证 书 使 用 被 称 作 
ASN.1 的 著名 标准 。 

hashing method ( 散 列 方法 ) 存 取 散 列 文件 的 一 
种 方法 。 

hashtag (标签 ) 在 推 文中 指明 重要 单词 的 方式 。 
它 以 一 个 “#” 符 号 做 开头 。 

HDMI(High-Definition Multimedia Interface) (高 
清 多 媒体 接口 ) 对 于 已 存在 模拟 视频 标准 的 
数字 替换 。 

header ( 头 ) 在 路 由 或 其 他 的 用 途中 添加 至 包 开 
始 部 分 的 信息 。 

heuristic search (启发 式 搜 索 ) 使 用 规则 或 有 用 
信息 提高 搜索 效率 的 一 种 搜索 方法 。 

hexadecimal digit (十 六 进 制 数 ) 十 六 进 制 系统 
中 的 符号 。 

hexadecimal system (十 六 进 制 系统 ) 十 六 进 制 
系统 中 的 数字 ， 它 们 是 0、1、2、3、4、5、56、 
1 8 9 A BB, GC, DB 

hierarchical modek 层 次 模型 ) 一 种 数据 库 模型 ， 
数据 以 树 状 结构 组 织 ， 以 便 从 上 向 下 搜索 。 

high-level language (高 级 语言 ) 一 种 可 移植 的 
编程 语言 ， 只 需要 程序 员 关 注 应 用 层面 而 非 某 
一 个 计算 机 或 操作 系统 的 结构 。 

high-order logic (高 阶 逻 辑 ) 一 种 扩展 了 谓词 逻 
辑 中 的 量词 和 范围 的 逻辑 ， 此 逻辑 把 谓词 也 看 
成 变量 。 

hold state (保持 状态 ) 任务 等 待 装 人 内 存 的 状态 。 

home address (内 部 地 址 ) 在 散 列 表 中 ， 由 散 
列 算法 生成 的 首 地 址 。 

home directory ( 主 目录 ) 在 UNIX 或 Linux 中 ， 
用 户 首次 登录 后 所 处 在 的 目录 。 

home page (主页 ) 网 上 可 用 的 超 文本 文档 的 主 
页 面 。 

host (主机 ) 网 络 上 的 站 点 或 是 节点 。 


host identifier (主机 标识 符 ) 站 点 的 标识 符 。 

hub (集线器 ) 连接 一 个 网 络 中 其 他 设备 的 设备 。 

Huffman coding ( 赫 夫 曼 编 码 ) 一 种 使 用 可 变 长 
度 码 的 统计 压缩 方法 。 

hypertext ( 超 文本 ) 带 有 其 他 文档 引用 链接 的 
文档 。 

Hypertext Markup language ( HTML ) ( 超 文 本 标 
记 语 言 ) 用 于 指定 Web 文档 的 内 容 和 格式 的 
计算 机 语言 ， 允 许 文 本 包含 字体 、 布 局 、 骨 人 
图 形 以 及 链接 到 其 他 文档 。 

Hypertext Transfer Protocol (HTTP)( 超 文本 传输 
协议 ) 该 协议 用 于 在 互联 网 中 检索 Web 页 面 。 

identifier (标识 符 ) 在 编程 语言 中 给 一 个 对 象 的 
名 称 。 

image processing (图 像 处 理 ) 人 工 智 能 的 一 个 
研究 领域 ， 处 理 目 标的 感知 问题 一 智能 主体 的 
人 工 眼睛 。 

imperative language (强制 性 语言 ) 过 程 化 语言 
的 男 一 个 名 字 。 

imperative paradigm (强制 性 范式 ) 过 程 化 范式 
的 另 一 个 名 字 。 

implementation phase (实现 阶段 ) 软件 系统 生 
命 周期 中 创建 实际 程序 的 阶段 。 

increment statement (递增 语句 ) 在 C 或 C++ 
中 ， 给 整 型 数 的 值 加 1 的 语句 。 

incremental model ( 增 量 模型 ) 软件 工程 中 的 
一 种 模型 。 该 模型 先 创 建 整个 包 ， 不 过 包 的 每 
个 模块 仅 包 含 一 个 空 沈 ， 然后 随 着 该 包 的 多 次 
反复 完善 ， 模 块 不 断 增 加 复杂 性 。 

index (索引 ) 数组 中 元 素 的 地 址 。 

indexed color (索引 颜色 ) 光栅 图 像 中 的 一 种 技 
术 ， 只 使 用 真 彩 的 一 部 分 对 每 个 应 用 中 的 颜色 


进行 编码 。 

indexed file (索引 文件 ) 使 用 索引 来 完成 随机 存 
取 的 文件 。 

infix (中 缀 ) 一 个 放置 于 两 个 操作 数 之 间 的 算法 
符号 。 


infrared waves (红外 波 ) 300GHz 到 400THz 的 
光谱 部 分 ， 被 用 来 短 范 围 交 流 。 

inheritance (继承 ) 通过 扩展 一 个 类 来 创造 一 个 
新 类 的 能 力 ， 该 新 类 保持 基 类 的 数据 对 象 和 方 
法 并 新 增 数据 对 象 和 方法 。 

inorder traversal (中 序 遍 历 ) 一 种 先 访问 左 子 
树 ， 再 访问 根 ， 最 后 访问 右 子 树 的 二 叉 树 的 遍 
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历 方 法 。 

input (输入 ) 操作 的 给 定数 据 。 

input data (输入 数据 ) 提交 给 计算 机 运行 一 个 
程序 的 用 户 信 息 。 

input/output (I/O) controller (输入 /输出 控制 器 ) 
控制 访问 输入 /输出 设备 的 设备 。 

input/output subsystem (输入 /输出 子 系统 ) 在 
计算 机 组 成 中 用 来 从 外 界 接收 数据 和 向 外 界 输 
送 数 据 的 部 分 。 

insert operation ( 插 人 操作 ) 关系 数据 库 中 的 一 
种 操作 ， 它 向 关系 中 插 人 一 个 元 组 。 

insertion sort (插入 排序 ) 一 种 排序 算法 。 将 列 
表 中 未 排序 部 分 中 的 第 一 个 元 素 插 人 该 列表 已 
排序 部 分 的 正确 位 置 。 

instruction (指令 ) 告诉 计算 机 要 做 什么 的 命令 。 

instruction register (指令 寄存 器 ) CPU 中 存放 
待 控制 单元 解释 的 指令 的 寄存 器 。 

integer (整数 ) 整 型 数字 ， 没 有 分 数 部 分 。 

integrated circuit (集成 电路 ) 在 一 块 独立 芯片 
上 集成 晶体 管 、 连 线 和 其 他 组 件 。 

integrity (完整 性 ) 保护 数据 ， 以 防 被 修改 、 插 
人 和 人、 删除 或 回复 的 一 个 安全 目标 。 

intellectual property (知识 产权 ) 无 形 资产 ， 例 
如 想法 、 发 明 、 技 术 、 艺 术 、 音 乐 以 及 著作 ， 
个 人 可 以 声明 他 的 所 有 权 。 

intelligent agent (智能 体 ) 能 感知 环境 、 从 环 
境 中 学 习 和 能 智能 地 与 环境 进行 交互 的 一 种 
主体 。 

interface (接口 ) 一 组 公共 操作 ， 或 是 待 传送 或 
从 运算 中 返回 的 数据 。 

internal level (内 层 ) 数据 库 中 定义 数据 实际 存 
储 位 置 的 部 分 。 

internal node (内 部 节点 ) 非 根 非 叶子 的 节点 。 

International Organization for Standardization 
(1SO) (国际 标准 化 组 织 ) 为 各 种 议题 定义 和 
开发 标准 的 全 球 性 组 织 。 

internet (互联 网 ) internetwork 的 缩写 。 

Internet (因特网 ) 全 球 使 用 的 基于 TCP/IP 协议 


体系 的 交互 式 网 络 。 

Internet address (因特网 地 址 ) 唯一 标识 因 特 
网 上 计算 机 的 32 位 地 址 。 

Internet Protocol ( IP) (网 际 协议 ) 在 TCP/IP 中 
负责 在 网 络 计算 机 间 传 送 数据 包 的 网 络 层 的 
协议 。 
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Internet Protocol version 6 (1Pv6 ) 增 广 地 址 空 
间 以 及 修订 包 和 协议 的 新 IP。 

Internet service provider (1SP )( 因 特 网 服务 提供 
商 ) 提供 因特网 服务 的 组 织 机 构 。 

internetwork (交互 式 网 络 ) 由 网 络 组 成 的 网 络 。 

interpretation (解释 ) 将 源 程序 中 的 每 一 行 解释 
成 目标 程序 并 执行 这 些 行 的 过 程 。 

interpreter (解释 器 ) 一 种 程序 ， 它 一 行 接 一 行 
地 翻译 高 级 语言 源 程序 ， 并 立即 执行 每 一 行 。 

interrupt driven I/O (中 断 驱动 的 输入 /输出 ) 一 
种 输入 /输出 形式 ，CPU 在 发 出 输入 /输出 命 
令 后 继续 服务 其 他 进程 ， 直 到 它 收 到 那个 输入 
/输出 操作 已 经 完成 的 中 断 信 和 号 。 

intersection operation( 交 操作 ) 两 个 集合 之 间 
的 操作 ， 结 果 为 两 个 集合 之 间 的 公共 元 素 。 

intersector gap ( 扇 区 内 间隔 ) 磁盘 上 的 扇 区 
间隔 。 

intertrack gap( 磁 道内 间隔 ) 磁带 上 的 磁道 间隔 。 

intracoded frame (Il-frame) (内 部 编码 帧 ) 在 
MPEG 中 ,一 个 独立 的 帧 。 

inverted file ( 倒 排 文件 ) 根据 第 二 关键 字 进 行 排 
序 的 文件 。 

IP address (IP 地 址 ) 参见 Internet address。 

IP datagram (IP 数据 报 ) 网 络 层 的 数据 单元 。 

IP new generation (IPng) JIPv6 的 另 一 个 名 字 。 

isolated 1/O (单独 输入 /输出 ) 一 种 输入 /输出 
模块 的 编 址 方法 ， 用 于 读 写 内 存 的 指令 完全 不 
同 于 读 写 输入 /输出 设备 的 指令 。 

Java ( Java 语言 ) 一 种 面向 对 象 的 编程 语言 ， 
用 于 创建 因特网 上 的 独立 执行 的 程序 或 动态 
文档 。 

job (作业 ) 当 一 个 程序 被 选中 准备 执行 时 ， 这 
个 程序 就 成 了 一 个 作业 。 

job scheduler (作业 调度 器 ) 用 来 选择 队列 中 
的 某 个 任务 进行 处 理 或 等 待 移 人 内 存 的 调度 
程序 。 

join operation (连接 操作 ) 在 关系 数据 库 中 将 两 
个 关系 在 基于 某 一 共同 属性 的 基础 上 进行 结合 
的 操作 。 

Joint Photographic Experts Group ( JPEG) ( 联 
合 图 像 专家 组 ) 用 于 压缩 图 像 的 一 个 标准 。 

kernel (内 核 ) 操作 系统 的 主体 部 分 。 

key ( 键 ) 用 来 识别 一 个 记录 (结构 ) 的 一 个 或 多 
个 字段 。 


key-distribution center ( KDC) ( 密 钥 分 发 中 心 ) 
可 信 的 第 三 方 ， 它 建立 通信 双方 共享 的 密 钥 。 

keyboard( 键 盘 ) 提供 单个 字符 输入 的 输入 设备 。 

land ( 纹 间 表面 ) 光盘 中 ， 在 位 模式 的 转换 中 没 
有 被 激光 照射 的 区 域 ， 通 常 表示 1 位 。 

last in ，first out (LIFO) (后 进 先 出 ) 一 种 算法 ， 
在 列表 中 最 后 被 添加 的 数据 项 最 先 移 出 。 

leaf (叶子 ) 图 或 树 中 出 度 为 0 的 叶子 。 

Lempel Ziv (LZ) encoding (LZ 编码 ) 一 种 使 用 
字典 的 压缩 算法 。 

Lempel Ziv Welch (LZW) encoding (LZW 编码 ) 
LZ 压缩 编码 的 一 种 增强 版 本 。 

lexical analyzer (词法 分 析 器 ) 编译 过 程 中 使 用 
的 一 种 程序 ， 它 一 个 符号 接 一 个 符号 去 读 源 程 
序 ， 然 后 建立 符号 记号 表 。 

linear list (线性 列表 ) 一 种 列表 结构 ， 该 结构 中 
除了 最 后 一 个 元 素 ， 其 他 每 个 元 素 都 有 唯一 的 
后 继 。 

link ( 链 ) 在 列表 结构 中 ， 标 识 列表 中 下 一 元 素 
的 字段 。 

linked list (链表 ) 元 素 的 排列 是 由 链接 域 决定 的 
线性 列表 结构 。 

linked list resolution (链表 解决 法 ) 散 列 方法 中 
的 一 种 冲突 解决 方法 ， 它 为 同义词 使 用 分 开 的 
区 域 ， 该 区 域 在 链表 中 维护 。 

Linux ( Linux 操作 系统 ) 由 Linus Torvalds 开发 
的 一 种 操作 系统 ， 它 使 得 运行 在 Intel 微 处 理 
器 上 的 UNIX 更 为 有 效 。 

LISP ( 表 处 理解 释 语 言 ) 把 每 个 事物 都 当成 表 的 
一 种 表 处 理 语言 。 

list( 列 表 ) 在 主 存 中 按照 一 定 顺 序 组 织 的 数据 集 。 
区 别 于 文件 。 

literal (文字 ) 在 程序 中 使 用 的 常量 。 

local area network (LAN)( 局 域 网 ) 连接 有 限 区 
域内 设备 的 网 络 。 

local variable (局 部 变量 ) 在 一 个 块 或 一 个 模块 
中 定义 的 变量 。 

logical operation (逻辑 操作 ) 结果 为 逻辑 值 ( 真 
或 假 ) 的 操作 。 

logical operator (逻辑 操作 符 ) 结合 布尔 值 来 获 
得 新 的 布尔 值 的 运算 符 。 

logical shift operation (你 辑 移 位 操作 ) 一 种 不 
保留 数字 符号 位 的 移 位 操作 。 

loop (循环 ) 程序 中 ， 使 得 一 个 或 多 个 语句 重复 


执行 的 一 种 结构 化 编程 结构 ; 在 图 中 指 一 条 在 
同一 顶点 开始 和 结束 的 线 。 

loop statement (循环 语句 ) 使 程序 重复 执行 其 
他 一 些 语句 的 语句 。 | 

lossless data compression (无 损 数据 压缩 ) 没 
有 数据 丢失 的 数据 压缩 ; 用 于 压缩 文本 或 程序 。 

lossy data compression (有 损 数据 压缩 ) 允许 
某 些 数据 丢失 的 数据 压缩 ; 用 于 图 形 、 音 频 或 
视频 压缩 。 

MAC addressees (MAC 地 址 ) 数据 链 路 层 的 
设备 的 地 址 。 

machine cycle (机 器 周期 ) 获取 、 解 码 并 执行 
运算 的 重复 集 。 

machine language (机 器 语言 ) 无 须 进 行 汇 编 或 
编译 就 可 执行 的 基于 本 机 中 央 处 理 器 的 指令 。 

macro ( 宏 ) 由 用 户 定制 设计 的 可 以 多 次 使 用 的 
过 程 。 

magnetic disk (磁盘 ) 一 种 有 随机 存储 能 力 的 存 
储 媒介 。 

magnetic tape (磁带 ) 一 种 有 顺序 存储 能 力 的 
存储 媒介 。 

Mail Transfer Agent (邮件 传送 代理 ) 用 在 电子 
邮件 通信 的 客户 端 -~ 服务 器 程序 。 

main memory ( 主 存 ) 计算 机 中 的 主要 内 存 ， 
包括 中 速 的 随机 存 取 存储 器 ， 参 腿 cache 
memory。 

maintainability (可 维护 性 ) 指 保持 系统 正确 运 
行 和 更 新 的 品质 。 

mantissa (尾数 ) 表示 浮 点 数 精 度 的 部 分 。 

mask ( 掩 码 ) 一 种 变量 或 常量 ,它们 包含 了 用 
于 控制 位 逻辑 操作 中 位 设 定 的 一 种 位 配置 。 

masquerading (伪装 ) 一 种 对 信息 完整 性 的 攻 
击 ， 在 攻击 中 攻击 者 冒充 别人 。 

master disk ( 主 盘 ) 在 CD-ROM 中 创建 的 第 一 
个 组 件 。 

master file ( 主 文件 ) 包含 与 应 用 程序 有 关 的 当 
前 最 新 数据 的 永久 保存 文件 。 

medium access control ( MAC ) address (MAC 
地 址 ) 参见 data link layer address。 

memory (内 存 ) 由 随机 存储 器 和 只 读 存 储 器 组 
成 的 主要 存储 器 ， 用 于 存储 数据 和 程序 指令 。 

memory management (内 存 管理 ) 操作 系统 中 
控制 主 存储 器 使 用 的 组 件 。 

memory-mapped lMO (内 存 映 射 的 输入 /输出 ) 


大 语 直 445 


在 单一 地 址 空间 的 一 种 输入 /输出 模块 编 址 方 
法 ， 既 用 于 内 存 也 用 于 输入 /输出 设备 。 

Message Access Agent ( MAA ) (消息 访问 代理 ) 
用 于 获取 已 存储 电子 邮件 的 客户 端 - 服 务 器 
程序 。 

message authentication code (MAC ) (消息 验证 
码 ) 包含 双方 机 密 的 消息 摘要 。 

message digest (消息 摘要 ) 对 消息 应 用 散 列 函 
数 而 得 到 的 固定 长 度 的 字符 串 。 

message transfer agent ( MTA) (消息 传递 代理 ) 
在 因特网 上 传输 消息 的 SMTP 程序 。 

method (方法 ) 面向 对 象 语言 中 的 函数 。 

metropolitan area network (MAN) ( 城 域 网 ) 让 
及 一 个 城镇 的 网 络 。 

microcomputer (微型 计算 机 ) 体积 相对 较 小 ， 
可 置 于 桌面 的 计算 机 。 

Microsoft Disk Operating System ( MS-DOS ) 
基于 DOS 的 操作 系统 ， 由 微软 开发 。 

modal logic ( 模 态 逻辑 ) 包含 确定 性 和 可 能 性 的 


扩展 逻辑 。 


modem (调制 解 调 器 ) 调制 器 - 解 调 器 的 组 合 。 

modularity (模块 化 ) 把 大 的 工程 分 解 成 小 的 部 
分 ， 以 利于 理解 和 操作 。 

modulator (调幅 器 ) 将 一 个 大 的 项 目 分 解 为 
小 的 部 分 ， 这 些 部 分 可 以 被 很 容易 地 理解 和 
处 理 。 

module (模块 ) 对 工程 使 用 模块 化 后 建立 的 一 个 
小 部 分 。 

modulo division ( 求 模 ) 将 两 数 相 除 并 保留 余数 。 

monitor (监视 器 ) 提供 输出 的 非 存储 设备 。 

Monitor (监视 器 ) 这 个 监视 器 展示 输出 ， 同 时 
展示 键盘 的 输入 。 

monoalphabetic cipher ( 单 表 置换 密码 ) 相同 的 
字符 总 是 以 相同 的 方式 进行 加 密 而 非 根据 其 在 
文本 中 位 置 进行 加 密 的 一 种 密码 。 

monoprogramming ( 单 道 程序 ) 在 每 一 时 刻 只 
允许 一 个 程序 存在 内 存 中 的 技术 。 

moral rule (道德 规范 ) 道德 的 原则 ， 要 求 我 们 
应 该 避免 做 出 违反 普遍 道德 的 行为 。 

moral rules (道德 规范 ) 第 一 条 道德 准则 声明 ， 
当做 出 道德 决策 的 时 候 ， 我 们 需要 考虑 这 个 决 
策 是 否 与 普遍 接受 的 道德 准则 相 一致 。 

Moving Pictures Experts Group ( MPEG) (运动 
图 像 专家 组 ) 一 种 用 来 压缩 音频 和 视频 信和 号 
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的 有 损 压 缩 方 法 。 

MPEG audio layer (MP3 )(MPEG 第 三 代 音 频 压 
缩 格式 ) 基于 MPEG 的 音频 压缩 标准 。 

multidimensional array (多 维 数组 ) 元 素 有 一 级 
以 上 索引 的 数组 。 

Multiple lnstruction Stream, Single Data 
Stream(MISD) (多 指令 单数 据 ) 多 个 流 运行 
在 单一 的 数据 上 的 计算 机 。 

multiple instruction_stream, multiple data 
stream(MIMD) (多 指令 多 数据 ) 有 多 个 CU， 
多 个 ALU， 多 个 内 存单 元 的 计算 机 。 

multiprogramming (多 道 程序 ) 人 允许 一 个 以 上 程 
序 驻 于 内 存 中 并 被 处 理 的 技术 。 

multithreading (多 线程 ) 某 些 语言 ， 如 Java 所 
支持 的 并 行 处 理 。 

mutual exclusion ( 互 斥 ) 由 操作 系统 强加 于 资 
源 之 上 的 一 种 情形 ， 该 情形 是 有 的 资源 只 能 被 
一 个 进程 持 有 。 

name (名 字 ) 在 关系 数据 库 术 语 中 ， 关 系 的 标 
识 符 。 

name space (名 字 空 间 ) 在 网 络 上 分 配给 一 台 
机 器 的 所 有 名 字 。 . 

network (网 络 ) 一 个 连接 多 个 可 共享 资源 节点 
的 系统 。 

network layer( 网 络 层 ) TCP/IP 模型 中 的 第 三 层 ; 
负责 从 起 始 主机 发 送 包 至 最 终 目 标 。 

network model (网 络 模型 ) 一 种 数据 库 模 型 ， 
该 模型 中 一 个 记录 可 以 有 多 个 父 记 录 。 

neural network (神经 网 络 ) 人 脑 中 的 神经 元 
网 络 。 

neuron (神经 元 ) 在 人 脑 和 神经 系统 中 负责 传送 
信息 的 个 体 单元 。 

new master file (新 主 文件 ) 当 文 件 更 新 时 ， 由 
旧 文 件 创建 而 来 的 主 文件 。 

news (新 闻 ) Facebook 允许 用 户 向 朋友 发 布 新 
闻 (被 称 作 更 新 )， 可 以 是 一 条 长 的 消息 (多 达 
60000 个 字符 )， 网 页 的 链接 ， 照 片 或 是 视频 。 

news(remove) (多 余 ) 

no preemption ( 非 抢占 式 ) 操作 系统 不 能 临时 
分 配 资源 的 情形 。 

node (节点 ) 在 数据 结构 中 ， 既 包含 数据 也 包含 
处 理 该 数据 结构 的 结构 化 元 素 的 一 种 元 素 。 

node-to-node (点 对 点 传递 ) 由 一 个 节点 传 向 下 
一 个 节点 的 数据 传递 。 


“nonpolynomial problem ( 非 多 项 式 问题 ) 不 能 


用 多 项 式 复 杂 性 解决 的 问题 。 

nonpositional number system ( 非 位 置 数字 系统 ) 
一 种 数字 系统 ， 符 号 的 位 置 不 定义 符号 的 值 。 

Nonstorage device ( 非 存储 设备 ) 非 存储 设备 
允许 CPU 或 存储 器 来 和 外 界 进 行 通信 ， 但 是 
它们 不 能 够 存储 信息 。 

nonstorage device ( 非 存储 设备 ) 允许 CPU 和 
存储 器 在 没有 存储 信息 时 进行 通信 的 设备 。 

normal form ( NF) (范式 ) 关系 数据 库 规 范 化 过 
程 中 的 一 步 。 

normalization (规范 化 ) 在 关系 数据 库 中 同一 个 
关系 数据 模型 应 用 范式 的 进程 。 

NOT operation (“ 非 ” 操 作 ) 将 0 变 1 或 将 1 
变 0 的 操作 。 

null pointer ( 空 指针 ) 不 指向 任何 数据 的 指针 。 

number system (数字 系统 ) 使 用 一 套 符号 定义 
一 个 值 的 系统 。 

object program (目标 程序 ) 由 编译 程序 或 解释 
程序 产生 的 机 器 语言 代码 。 

object-oriented analysis (面向 对 象 分 析 ) 使 用 
面向 对 象 语言 的 开发 过 程 中 的 分 析 阶 段 。 

object-oriented database (面向 对 象 数 据 库 ) 一 
种 数据 被 当 作 结构 (对 象 ) 进行 处 理 的 树 据 库 。 

object-oriented design (面向 对 象 设计 ) 为 面向 
对 象 编程 中 的 每 一 个 类 给 出 细节 和 代码 。 

object-oriented language (面向 对 象 语 言 ) 一 
种 将 对 象 及 其 相关 操作 绑 定 在 一 起 的 程序 设计 
语言 。 

object-oriented paradigm (面向 对 象 范式 ) 程 
序 作 用 于 活动 对 象 的 范式 。 

octal digit (八进制 数字 ) 以 8 为 基 的 数字 。 

octal system (八进制 系统 ) 以 8 为 基 的 数字 系 
统 ; 八进制 数字 为 0 一 7。 

old master file ( 旧 主 文件 ) 该 主 文件 与 事务 文 
件 相 互 关联 用 于 创建 新 主 文件 。 

one-dimensional array (一 维 数组 ) 只 有 一 级 索 
引 的 数组 。 

one-time pad (一 次 一 密 乱 码 ) 对 于 每 一 次 加 密 ， 
键 值 都 被 随机 选取 的 一 种 密码 。 

one’s complement (二 进 制 反 码 ) 将 变量 中 的 
值 按 位 取 反 的 位 运算 。 

open addressing resolution (开放 寻 址 解决 法 ) 
当 新 的 地 址 在 主 区 时 的 一 种 冲突 解决 法 。 


operability (可 操作 性 ) 描述 系统 可 用 程度 的 品 
质 因素 。 

operand (操作 数 ) 语句 中 执行 运算 的 对 象 。 与 
运算 符 相 对 应 。 

operating system (操作 系统 ) 能 够 控制 计算 环 
境 并 能 提供 用 户 接 口 的 软件 。 

operator (运算 符 ) 一 种 表示 在 数据 (操作 数 ) 
上 运算 操作 的 语法 标记 。 与 操作 数 相对 应 。 

optical storage device( 光 存储 设备 ) 一 种 使 用 
光 (激光 ) 来 存储 和 检查 数据 的 IO 设备 。 

OR operation (“或 ”操作 ) 仅 当 两 个 输入 皆 为 
0 时 结果 才 为 0， 其 他 情况 为 1 的 二 进 制 操作 。 

output (输出 ) 运算 的 结果 。 

output data( 输 出 数据 ) 运行 计算 机 程序 的 结果 。 

output device (输出 设备 ) 只 可 写 而 不 可 读 的 
设备 。 

overflow (溢出 ) 该 情况 发 生 在 试图 用 不 足够 的 
位 去 表示 一 个 二 进 制 数值 。 

packet-filter firewall ( 包 过 滤 防 火 墙 ) 使 用 过 滤 
表 来 保护 机 构 的 防火 墙 。 

packetizing (分 组 ) 将 数据 封装 成 包 。 

page( 页 ) 程序 中 众多 大 小 相等 的 扇 区 中 的 一 个 。 

paging (分 页 调度 ) 一 种 多 道 程 序 技术 ， 该 技术 
将 内 存 分 成 称 为 帧 的 大 小 相等 的 扇 区 。 

palette color ( 调 色 板 ) 参见 indexed color。 

parallel processing (并 行 处 理 ) 多 处 理 的 一 种 
形式 ， 通 过 允许 多 个 处 理 器 同时 运行 来 加 速 。 

parallel system (并 行 系统 ) 在 同一 机 器 上 有 多 
个 CPU 的 操作 系统 。 

parameter (参数 ) 传 给 函数 的 值 。 

parent ( 父 类 ) 有 一 个 或 多 个 子 类 节点 的 树 节 点 
或 图 节点 。 

parent directory ( 父 目录 ) 当前 目录 的 直属 上 级 
目录 。 

parser (语法 分 析 器 ) 进行 语法 分 析 的 实体 。 

partitioning (分 区 调度 ) 一 种 多 道 程 序 技 术 ， 它 
将 内 存 分 成 可 变 大 小 的 区 。 

Pascal (Pascal 语言 ) 按 一 种 特殊 目的 设计 的 程 
序 语言 ， 即 通过 强调 结构 化 编程 方法 向 初学 者 
传授 程序 设计 。 

pass by reference ( 按 引用 传送 ) 一 种 参数 传递 
技术 ， 被 调用 的 函数 通过 使 用 一 个 别名 来 引用 
传递 的 参数 。 

pass by value ( 按 值 传送 ) 将 变量 的 值 传 给 函数 
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的 一 种 参数 传送 技术 。 

patent (专利 ) 知识 产权 的 权利 。 

path (路 径 ) 一 系列 节点 ， 每 一 个 顶点 和 其 他 节 
点 相 邻 。 | 

peer-to-peer paradigm ( P2P 模式 ) 两 个 对 等 的 
计算 机 可 以 相互 通信 以 交换 服务 的 模式 。 

penetration attack (入 侵 攻 击 ) 入 侵 意 味 着 打破 
一 个 系统 以 获取 存储 在 计算 机 或 是 计算 机 网 络 
上 的 数据 。 

penetration attack (人 侵 攻 击 ) 非法 获取 计算 机 
信息 或 造成 损害 的 入侵 行为 。 

perceptron (感知 器 ) 在 神经 网 络 中 ， 一 个 简单 
的 类 似 于 神经 元 的 元 素 。 

perceptual encoding (感知 编码 ) 使 用 音频 进行 
编码 的 一 种 类 型 。 

physical agent (物理 智能 体 ) 能 用 来 执行 一 系 
列 任务 的 可 编程 系统 (机 器 人 )。 

physical layer (物理 层 ) TCP/IP 模型 中 的 第 一 
层 ; 负责 在 网 络 中 的 信号 和 位 传送 。 

pico (pico) Unix 上 的 另 一 种 文本 编辑 器 。 

picture element (pixel)( 像 素 ) 图 像 的 最 小 单位 。 

pipelining (流水 线 ) 现代 计算 机 通过 将 指令 的 
不 同 阶段 与 下 一 阶段 结合 来 提高 吞吐 量 的 一 种 
技术 。 其 思想 是 : 如 果 控 制 单元 可 以 同时 进行 
两 或 三 个 阶段 ， 那 么 下 一 条 指令 可 以 在 前 一 条 
指令 完成 之 前 进行 。 

pit ( 坑 ) 在 光盘 中 被 激光 烧灼 后 形成 的 区 域 ， 用 
于 表示 位 模式 下 信息 ,通常 表 示 0。 

pixel (像素 ) 参见 picture element。 

place value (位 置 量 ) 在 位 置 数字 系统 中 ， 与 位 
置 相关 联 的 值 。 

plaintext (明文 ) 加 密 前 的 原文 。 

point-to-point connection (点 到 点 连接 ) 两 设备 
间 的 专用 传输 。 

pointer (指针 ) 存放 地 址 的 变量 或 常量 ， 可 以 访 
问 放置 于 他 处 的 数据 。 

polyalphabetic cipher (多 字 码 密码 ) 明文 的 一 
个 字符 将 根据 它 在 文本 中 出 现 的 位 置 ， 在 密 文 
中 变 成 一 个 不 同 的 字符 的 技术 。 

polycarbonate resin ( 聚 碳 酸 酯 树脂 ) 在 CD- 
ROM 制作 中 ， 一 种 注入 模子 中 的 材料 。 

polymorphism (多 态 ) 在 C++ 中 ， 使 用 同一 
个 名 字 定 义 多 个 操作 以 便 在 相关 类 中 做 不 同 
事情 。 
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polynomial problem (多 项 式 问 题 ) 能 够 在 可 接 
受 的 时 间 范 围 内 由 计算 机 解决 的 问题 。 

pop (出 栈 ) 栈 的 删除 操作 。 

port address (端口 地 址 ) 见 port number。 

port number (端口 号 ) 在 TCP 和 UDP 中 ， 用 
来 区 分 不 同 进程 的 地 址 。 

portability (可 移植 性 ) 描述 一 个 操作 系统 可 以 移 
植 到 其 他 的 硬件 环境 中 难 易 程 度 的 品质 因数 。 

portability process scheduler (可 移植 性 进程 调 
度 程序 ) 暂 无 此 术语 。 存 在 术语 进程 调度 器 ， 
但 是 没有 可 移植 性 进程 调度 程序 。 

positional number system (位 置 数字 系统 ) 一 
种 符号 的 位 置 定 义 了 其 值 的 数字 系统 。 

postfix (后 级) 一 种 把 运算 符 放置 在 其 操作 数 之 
后 的 算术 符号 。 

postorder traversal (后 序 遍 历 ) 先 访问 左 子 树 ， 
再 访问 右 子 树 ， 最 后 访问 根 的 二 叉 树 遍历 方法 。 

pragmatic analysis ( 语 用 分 析 ) 一 种 句子 的 分 
析 方 法 ， 通 过 排除 二 义 性 ， 发 现 单词 的 真实 
含义 。 

predicate logic (谓词 逻辑 ) 一 种 逻辑 系统 ， 其 中 
的 量词 能 应 用 于 项 (term)， 但 不 能 应 用 于 谓词 。 

predicted frame (P-frame)( 预 帧 ) 在 MPEG 中 ， 
与 在 前 的 1 帧 和 B 帧 相关 的 帧 。 

Predictive encoding (预测 误差 ) 将 两 个 样本 之 
间 的 不 同 进行 编码 ， 而 不 是 将 样本 本 身 进 行 
编码 。 

prefix (前 级 ) 一 种 把 运算 符 放 置 在 其 操作 数 之 
前 的 算术 符号 。 

preorder traversal (前 序 人 遍历 ) 二叉树 的 一 种 
遍历 方法 ， 该 遍历 算法 遍历 顺序 为 先 访 问 左 子 
树 ， 再 访问 根 ， 最 后 访问 右 子 树 。 

prime area ( 主 区 ) 在 一 个 散 列 表 中 ， 该 存储 区 
域 包含 内 部 地 址 。 

printer (打印 机 ) 产生 硬 拷 贝 的 输出 设备 。 

privacy( 隐 私 ) 个 人 对 一 些 信 息 进行 保密 的 权利 。 

privacy (隐私 ) 如今 , 公民 大 量 的 跟 人 信息 被 私 
有 或 公共 机 构 收 集 。 一 些 国际 组 织 针 对 这 些 信 
息 的 使 用 出 台 了 道德 规则 。 

private key ( 私 钥 ) 公开 密 钥 密 码 体系 的 两 种 密 
钥 之 一 。 

procedural language (过 程 化 语言 ) 过 程 化 范式 
中 的 计算 机 语言 。 

procedure paradigm (过 程 化 范式 ) 程序 使 用 过 


程 作用 于 被 动 对 象 的 范式 。 

procedure-oriented analysis (面向 过 程 分 析 ) 开 
发 过 程 中 的 一 个 分 析 阶 段 ， 该 开发 是 使 用 过 程 
化 语言 进行 的 开发 。 

procedure-oriented design (面向 过 程 设计 ) 开 
发 过 程 中 的 一 个 设计 阶段 ， 该 开发 是 使 用 过 程 
化 语言 进行 的 开发 。 

process (进程 ) 正在 执行 的 程序 。 

process manager (进程 管理 器) 操作 系统 中 用 
来 控制 进程 的 组 件 。 

process scheduler (进程 调度 器 ) 一 种 操作 系统 
机 制 ， 它 用 来 分 配 那些 正在 等 待 使 用 CPU 的 
进程 。 

product (乘积 ) 将 一 系列 数字 数据 进行 相 乘 得 
到 的 结果 。 

program (程序 ) 一 系列 指令 的 集合 。 

program counter (程序 计数 器 ) CPU 中 的 一 个 
寄存 器 ， 它 存 有 内 存 中 下 一 条 将 被 执行 指令 的 
地 址 。 

programmable read-only memory ( PROM) (可 
编程 只 读 存 储 器 ) 由 制造 商用 电 设置 好 内 容 
的 存储 器 ; 它 可 以 被 用 户 重新 设置 。 

programmed 1/O (程序 控制 输入 /输出 ) 输入 / 
输出 的 一 种 形式 ， 在 这 种 形式 中 CPU 必须 等 
待 输入 / 输出 操作 结束 。 

programming language (程序 设计 语言 ) 一 种 
具有 有 限 词 汇 和 语法 规则 的 语言 ， 它 用 于 解决 
计算 机 上 的 问题 。 

project operation (投影 操作 ) 在 关系 数据 库 中 
的 一 种 操作 ， 根 据 某 种 标准 选择 列 集 。 

PROLOG (PROLOG 语言 ) 一 种 能 建立 事实 数 
据 库 和 规则 知识 库 的 编程 语言 。 

propositional Logic (命题 逻辑 ) 一 种 基于 逻辑 
操作 符 和 命题 术语 的 逻辑 系统 。 

protocol (协议 ) 在 计算 机 间 交 换 数 据 的 规则 集 。 

protocol layering (协议 层 ) 对 于 解决 一 个 困难 
的 任务 ， 使 用 一 系列 协议 以 产生 规则 层级 的 
思想 。 

proxy firewall (代理 防火 墙 ) 存在 于 客户 计算 机 
和 公司 计算 机 之 间 的 防火 墙 。 它 仅仅 接受 来 自 
客户 计算 机 的 合法 信息 。 

proxy firewall (代理 防火 墙 ) 存在 于 客户 计算 机 
和 公司 计算 机 之 间 的 代理 计算 机 (有 时 被 称 作 
应 用 网 关 )。 
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pseudocode ( 伪 代 码 ) 类 似 英语 的 语句 ， 它 遵 
从 松散 的 语法 定义 ， 并 用 来 表达 某 种 算法 或 功 
能 的 设计 。 

public key ( 公 钥 ) 公 钥 加 密 中 的 一 种 密 钥 ， 它 
对 公众 公开 。 

public-key certificate ( 公 钊 证 书 ) 一 种 把 实体 与 
公 钥 捆绑 在 一 起 的 证 书 。 

push (人 栈 ) 栈 中 的 插入 操作 。 

quantifier (量词 ) 谓词 逻辑 中 使 用 的 两 个 运算 
符 : 和 。 

quantization (量化 ) 从 一 个 有 限 的 值 集中 分 配 值 。 

queue (队列 ) 一 种 线性 表 ， 数 据 只 能 在 一 端 插 
和信 ， 称 为 队 尾 ， 而 且 只 能 在 另 一 端 删除 ， 称 为 
队 首 。 

radix ( 基 ) 位 置 数 字 系 统 中 的 基 。 

random access (随机 存 取 ) 一 种 存储 方法 ， 它 
允许 按 任意 次 序 存 取 数 据 。 

random access memory ( RAM) (随机 存 取 存储 
器 ) 计算 机 的 主 存储 器 ， 它 存储 数据 和 程序 。 

raster graphic (光栅 图 形 ) 参见 bitmap graphic。 

read-only memory ( ROM) (只 读 存 储 器 ) 持久 
性 存储 器 ， 其 存储 内 容 不 可 改变 。 

read/write head ( 读 / 写 头 ) 硬盘 中 读 / 写 数据 
的 设备 。 

ready state (就 绪 状态 ) 在 进程 管理 中 ， 处 于 这 
种 状态 的 进程 正 等 待 获得 CPU 的 使 用 权 。 

real (实数 ) 有 整数 部 分 和 小 数 部 分 的 数字 。 

real-time system (实时 系统 ) 一 种 操作 系统 ， 
它 能 在 指定 的 时 间 限 制 下 完成 一 项 任务 。 

rear (尾部 ) 使 用 人 队列 操作 时 ， 最 后 一 个 插 到 
队列 中 的 元 素 。 

record (记录 ) 描述 一 实体 的 信息 。 

recursion (递归 ) 一 个 设计 成 自我 调用 的 函数 。 

reduced instruction set computer ( RISC ) (精简 
指令 集 计算 机 ) 一 种 只 使 用 那些 常用 指令 的 
计算 机 。 

register (寄存 器 ) 一 种 可 存放 临时 数据 的 快速 
独立 的 存储 单元 。 

relation (关系 ) 关系 数据 库 中 的 表 。 

relational database (关系 数据 库 ) 一 种 数据 库 
模型 ， 数 据 组 织 在 被 称 为 关系 的 相关 表 中 。 

relational database management system (RDBMS) 
(关系 数据 库 管 理 系 统 ) 用 来 处 理 关 系数 据 库 
模型 中 关系 的 程序 集 。 


relational model (关系 模型 ) 参见 relational database。 

relational operator (关系 运算 符 ) 一 种 用 于 比较 
两 个 值 的 运算 符 。 

relative pathname (关系 路 径 ) 依据 工作 目录 创 
建 的 文件 路 径 

reliability (可 靠 性 ) 描述 系统 总 体操 作 的 可 信和 
可 靠 程度 的 品质 因素 。 

remote login (远程 登录 ) 登录 到 与 本 地 计算 机 
相连 的 远程 计算 机 上 。 

repetition( 循 环 ) 结构 化 编程 中 的 三 种 结构 之 一 。 

replaying (回复 ) 一 种 对 信息 完整 性 的 攻击 ， 攻 
击 者 先 截取 消息 ， 再 重新 传送 。 

replicated distributed database (复制 的 分 布 式 
数据 库 ) 一 种 在 每 个 站 点 都 拥有 另 一 站 点 的 
副本 的 数据 库 。 

resolution (分 辨 率 ) 图 像 处 理 中 的 扫描 速率 ; 
用 每 单元 中 像素 点 的 数目 来 表示 。 

resource holding (资源 持 有 ) 一 种 状态 : 进程 
持 有 一 个 资源 ， 却 不 能 使 用 ， 一 直 要 等 到 所 有 


其 他 资源 也 可 用 。 

retrieval (检索 ) 查找 并 返回 列表 中 某 个 元 素 
的 值 。 

retweet (转发 tweet) 将 一 条 tweet 转 发 给 其 他 
的 Twitter 用 户 。 


RGB ( 红 绿 蓝 ) 一 种 颜色 系统 ， 其 中 色彩 用 红 、 
绿 、 蓝 三 主 色 的 组 合 来 表示 。 

Roman number system (罗马 数字 系统 ) 罗马 
人 使 用 的 非 位 置 数字 系统 。 

root ( 根 ) 树 的 第 一 个 节点 。 

root directory ( 根 目录 ) 文件 层级 的 最 高 层 。 

rotational speed (角速度 ) 磁盘 的 旋转 速度 。 

router (路 由 器 ) 一 种 工作 在 TCP/IP 体系 前 三 层 
的 连接 独立 网 络 的 设备 。 路 由 器 根据 数据 包 的 
目的 地 址 来 确定 它 的 路 由 。 

routing (路 由 ) 路 由 器 的 工作 过 程 。 

row-major storage ( 行 主 序 存储 ) 内 存 中 存储 数 
组 元 素 的 一 种 方法 ， 数 组 元 素 一 行 一 行 地 存储 。 

RSA cryptosystem (RSA 密码 系统 ) 由 了 River、 
Shamir 和 Adelman 设计 的 一 种 通用 公共 密码 
系统 ， 它 使 用 指数 e 和 d，e 用 于 公共 场所 ，d 
用 于 私人 场所 。 

RSA cryptosystem ( RSA 密码 系统 ) RSA 密码 
系统 是 通用 的 公 钥 算法 之 一 。 

ruled-based system (基于 规则 的 系统 ) 一 种 知 
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识 表示 系统 ， 其 中 使 用 一 套 规则 ， 从 已 知 的 事 
实 推出 新 的 事实 。 

run-length encoding (游程 长 度 编码 ) 一 种 无 损 
压缩 方法 ， 在 这 种 编码 方法 中 ,一 系列 的 重复 
符号 由 该 符号 和 重复 的 个 数 来 表示 。 

running state (运行 状态 ) 在 进程 管理 中 ， 进 程 
使 用 CPU 的 状态 。 

sampling (采样 ) 等 间隔 地 测量 。 

sampling rate (采样 率 ) 在 采样 过 程 中 每 秒 钟 采 
集 到 的 样本 数 。 

scanning (扫描 ) 图 像 到 数字 化 数据 的 转换 ， 通 
过 对 均匀 分 布点 的 密度 和 色彩 进行 采样 。 

scheduler (调度 程序 ) 把 作业 从 一 个 状态 转换 
到 另 一 个 状态 的 程序 。 

scheduling (调度 ) 为 不 同 的 程序 分 配 操作 系统 
的 资源 ， 并 且 决 定 什么 时 间 什 么 程序 使 用 哪个 
资源 。 

scheme (模式 ) LISP 语言 的 实际 标准 。 

scientific notation (科学 计数 法 ) 数字 的 表示 方 
法 ， 在 十 进 制 小 数 点 的 左边 只 有 一 个 数字 ，10 
的 寡 次 定义 了 十 进 制 小 数 点 移动 的 位 置 。 

search space (查找 空间 ) 可 能 状态 的 集合 ， 使 
用 查找 方法 进行 问题 求解 时 要 查找 的 状态 空间 。 

searching (查找 ) 根据 预先 指定 值 作为 查找 参 
数 ， 在 查找 表 的 过 程 中 确定 一 个 或 多 个 包含 给 
定 元 素 的 过 程 。 

secondary storage device (二 级 存储 设备 ) 参 
见 auxiliary storage 。 

secret key ( 密 钥 ) 保密 密 钥 加 密 体 系 中 仅 被 两 
个 参与 者 享有 的 钥匙 。 

sector ( 扇 区 ) 磁盘 磁道 的 一 部 分 。 

Secure Hash Algorithm ( SHA) (安全 散 列 算法 ) 
由 NIST 开发 的 一 种 标准 散 列 函数 。 

Secure Shell { SSH) 客户 端 - 服 务 器 程序 ， 提 
供 安 全 登录 。 

security (安全 ) 一 种 描述 未 授权 用 户 访 问 数据 
难 易 程 度 的 品质 因素 。 

secutiry attack (安全 攻击 ) 一 种 对 系统 安全 目 
标 形成 威胁 的 攻击 。 

security goal (安全 目标 ) 信息 安全 三 个 目标 之 
一 : 机 密 性 、 完 整 性 和 可 用 性 。 

seek time ( 寻 道 时 间 ) 在 访问 磁盘 中 ， 需 要 移 
动 读 / 写 磁头 到 数据 所 在 磁道 的 时 间 。 

segment ( 段 ) 包 的 一 部 分 。 


segmentation (分 割 ) 图 像 处理 中 的 一 个 步骤 ， 
它 把 图 像 分 成 均匀 的 片段 或 区 域 。 

select operation (选择 操作 ) 关系 数据 库 中 一 种 
选择 元 组 集 的 操作 。 

selection (选择 ) 结构 化 编程 中 三 种 结构 之 一 。 

selection sort (选择 排序 ) 一 种 排序 算法 ， 未 排 
序 子 表 中 的 最 小 元 素 被 选择 出 来 ， 放 置 在 已 排 
序 子 表 的 末尾 。 

semantic analysis (语义 分 析 ) 对 句子 中 的 单词 
或 语句 中 的 符号 的 含义 进行 分 析 。 

semantic network (语义 网 ) 一 种 节点 代表 对 象 ， 
边 代 表 对 象 间 的 关系 的 图 。 

sequence (顺序 ) 结构 化 编程 中 的 三 种 结构 
之 一 。 

sequential access (顺序 存 取 ) 一 种 存 取 方法 ， 
文件 中 的 记录 只 能 从 第 一 个 元 素 开 始 连 续 地 
存 取 。 

sequential file (顺序 文件 ) 一 种 文件 结构 ， 文 件 
中 的 数据 必须 从 第 一 个 元 素 开 始 连续 地 处 理 。 

sequential search (顺序 查找 ) 一 种 用 于 线性 列 
表 查 找 的 技术 ， 查 找 过 程 为 从 第 一 个 元 素 开 始 
逐个 查找 ， 直 到 元 素 的 值 等 于 找到 的 值 ， 否 则 
继续 查找 直到 列表 的 末尾 。 

server (服务 器 ) 客户 机 =- 服务 器 系统 中 提供 畏 
助 服务 (服务 器 程序 ) 的 集中 计算 机 。 

shell( 命 令 行 解释 器 ) 某 些 操作 系统 的 用 户 界面 ， 
如 UNIX。 

shift cipher ( 移 位 加 密 ) 一 种 替换 加 密 ， 其 中 的 
密 钥 定义 了 字母 向 字母 表 尾 部 的 移动 。 

siblings (兄弟 节点 ) 具有 同一 双亲 的 节点 。 

side effect (副作用 ) ”由 一 个 表达 式 赋 值 而 导致 
的 变量 值 的 改变 ; 由 一 个 调用 函数 执行 的 输入 
/输出 。 

sign out (注销 ) 结束 在 社交 媒体 的 成 员 资 格 。 

sign out (注销 ) 要 想 使 用 Facebook 你 需要 成 为 
其 中 的 一 员 ， 为 了 成 为 其 中 的 一 员 ， 你 需要 注 
册 。 想 要 结束 你 的 成 员 资格 ， 你 需要 注销 或 停 
用 你 的 账户 。 

sign-and-magnitude representation (符号 加 绝 
对 值 表 示 法 ) 一 种 整数 的 表示 方法 ， 其 中 一 位 
用 来 表示 符号 ， 其 余 位 则 表示 数量 大 小 。 

simple type (简单 类 型 ) 原子 数字 类 型 ， 例 如 整 
数 或 实数 。 


single instruction stream, multiple data stream 


(SIMD)( 单 指令 流 多 数据 流 ) 有 一 个 控制 单元 ， 
多 个 ALU， 一 个 存储 器 单元 的 计算 机 。 

single-user operating system ( 单 用 户 操作 系统 ) 
一 种 一 次 内 存 中 只 能 有 一 个 程序 可 以 运行 的 操 
作 系 统 。 

small computer system interface ( SCSI) (小 型 
计算 机 系统 接口 ) 一 种 带 并 行 接口 的 输入 / 输 
出 设备 控制 器 。 

snooping ( 嗅 探 ) 对 机 密 信息 的 非 授权 访问 。 

social contract (社会 契约 ) 道德 的 原则 ， 内 容 
为 : 社会 上 大 多 数 人 同意 的 行为 是 合法 的 。 

social contract (社会 契约 ) 社会 契约 理论 为 : 
社会 上 大 多 数 人 同意 的 行为 是 合法 的 。 

social media (社交 媒体 ) 人 们 用 来 分 享 思想 和 
信息 的 网 站 。 

social network (社交 网 络 ) 社交 媒体 的 别名 。 

software (软件 ) 用 来 帮助 计算 机 完成 工作 所 必 
需 的 应 用 程序 和 系统 程序 。 

software agent (软件 智能 主体 ) 在 人 工 智能 应 
用 系统 中 ， 被 设计 出 来 处 理 特殊 任务 的 程序 
集合 。 

software engineering (软件 工程 ) 结构 程序 的 
设计 和 编写 。 

software lifecycle (软件 生命 周期 ) 软件 包 的 寿命 。 

software quality (软件 质量 ) 软件 的 三 个 特征 
(可 操作 性 ， 可 维护 性 ， 可 转移 性 )。 

solvable problem (可 解 问 题 ) 一 个 可 用 计算 机 
解决 的 问题 。 

soma ( 胞 体 ) 含有 细胞 核 的 神经 细胞 体 。 

something inherent (所 固有 的 ) 申请 者 的 特征 ， 
如 ; 常见 的 签名 、 指 纹 和 声音 等 可 用 来 进行 实 
体 身 份 验证 。 

something known (所 知道 的 ) 申请 者 所 知道 的 
秘密 ， 这 些 秘密 可 被 身份 验证 中 的 验证 程序 
使 用 。 

something possessed (所 拥有 的 ) 属于 申请 者 ， 
能 标明 申请 者 身份 的 东西 。 

sort pass (分 类 扫描 ) 在 一 个 循环 中 由 一 个 分 类 
程序 检测 所 有 的 元 素 。 

sorting (排序 ) 用 来 对 列表 或 文件 进行 排序 的 处 
理 过 程 。 

source program ( 源 程 序 ) 包含 有 程序 员 撰写 的 
未 被 转化 为 机 器 语言 的 程序 语句 的 文件 ; 给 汇 
编程 序 或 编译 器 的 输入 文件 。 
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source-to-destination delivery ( 源 至 目的 地 的 传 
送 ) 指 将 数据 包 从 源 到 目的 地 的 传送 。 

spatial compression (空间 压缩 ) 对 帧 进行 
JPEG 压缩 。 

speech recognition (语音 识别 ) 自然 语音 处 理 
的 第 一 步 (人 工 智 能 )， 语 音信 号 被 分 析 ， 其 中 
所 包含 的 单词 序列 被 抽取 出 来 。 

spoofing (欺骗 ) 参见 masquerading。 

stack ( 栈 ) 一 个 受 限制 的 数据 结构 ， 其 数据 插 
人 和 删除 只 能 在 称 为 栈 顶 的 一 端 进行 。 

Standard Ethernet (标准 以 太 网 ) 以 10 Mpbs 速 
度 运 行 的 原始 以 太 网 。 

starvation ( 饿 死 ) 一 种 操作 系统 操作 上 的 问题 ， 
这 种 情况 下 一 个 进程 无 法 获取 所 需 的 资源 进行 


工作 。 
state chart (状态 图 ) 一 种 与 状态 图 类 似 的 图 ， 
但 在 面向 对 象 软件 工程 中 使 用 。 


state diagram (状态 图 ) 用 来 表示 程序 不 同 状 态 
的 图 。 

statement (语句 ) C 语 言 中 的 一 种 句法 构造 ， 
用 来 描述 函数 操作 。 

static RAM ( SRAM) (静态 随机 存储 器 ) 一 种 利 
用 传统 触发 器 门 电路 (只 含有 0 或 1 两 种 状态 
的 门 电路 ) 来 保存 数据 的 技术 。 

steganography ( 隐 写 术 ) 一 种 安全 技术 ， 通 过 
在 消息 上 覆盖 其 他 东西 来 隐藏 消 息 。 

storage device (存储 设备 ) 一 种 能 够 存储 大 量 
信息 并 可 在 将 来 检索 的 输入 /输出 设备 。 

stream cipher ( 流 密 码 ) 一 个 字符 一 次 进行 加 密 
和 解密 的 密码 。 

String (字符 串 ) 字符 的 集合 被 看 作 一 个 简单 的 
数据 单元 。 

string (字符 串 ) 字符 串 ,. 也 叫 字符 的 集合 ， 在 
不 同 的 语言 中 有 着 不 同 的 使 用 方法 。 在 C 语 
言 中 ， 字 符 串 是 一 个 字符 的 数组 。 在 C++ 中 ， 
字符 串 既 可 以 是 字符 的 数组 ， 也 可 以 是 一 种 数 
据 类 型 。 在 Java 中 ， 字 符 串 是 一 种 类 型 。 

structure chart (结构 图 ) 一 种 用 于 设计 和 文档 
化 的 工具 ， 用 系统 功能 层次 流 图 来 描述 程序 。 

structure program (结构 化 程序 ) 根据 软件 工程 
规则 编写 的 程序 。 

Structured Query Language (SQL) (结构 化 查询 
语言 ) 一 种 包括 数据 库 定 义 、 操 纵 和 控制 语 
句 的 数据 库 语 言 。 


452 大 语 共 


subalgorithm ( 子 算法 ) 一 段 独立 编写 的 算法 。 
它 可 为 算法 内 部 所 调用 执行 。 

subprogram ( 子 程序 ) 由 主 程序 调用 的 小 程序 。 

subroutine ( 子 例 程 ) 参见 subalgorithm。 

substitution cipher (替换 密码 ) 把 一 个 符号 替换 
成 另外 一 个 符号 的 密码 。 

subtree ( 子 树 ) 在 树 根 下 的 任何 相连 的 结构 。 

summation ( 求 和 ) 一 系列 数字 相 加 的 结果 。 

switch (交换 机 ) 将 网 络 中 的 组 件 连接 到 一 起 的 
设备 。 

switched WAN (交换 式 广 域 网 ) 由 几 种 介质 和 
几 个 开关 组 成 的 复杂 广域网 。 

symbolic language (符号 语言 ) 一 种 计算 机 语 
言 ， 比 机 器 语言 高 级 ， 它 通过 助 记 符 号 来 表示 
每 一 个 机 器 指令 并 具有 符号 数据 命名 的 能 力 。 

symmetric-key cipher (对 称 密 钥 密码 ) 一 种 
加 密 技 术 ， 在 加 密 和 解密 过 程 中 使 用 单一 的 
密 钥 。 

symmetric-key encryption (对 称 密 钥 加 密 ) 使 
用 对 称 密 钥 密 码 的 加 密 。 

synapse ( 突 触 ) 在 人 类 神经 系统 中 两 个 神经 元 
间 的 连接 。 

synonym (同义词 ) 在 散 列 表 中 ， 不 同 的 关键 字 
可 能 得 到 同一 内 部 地 址 。 

syntactic analysis (语法 分 析 ) 分 析 句 子 的 语法 。 

syntax (语法 ) 语言 的 “语法 ”规则 。 

syntax analyzer (语法 分 析 器 ) 检查 句子 语法 的 
过 程 。 

system documentation (系统 文档 ) 一 种 用 于 描 
述 软件 包 的 正式 的 整体 结构 的 记录 。 

TCP/IP protocol suite ( TCP/IP 协议 族 ) 定义 因 
特 网 传输 交换 的 五 层 协议 族 。 
TELNET { terminal network) (终端 网 络 ) 一 种 
通用 的 允许 远程 登录 的 客户 机 - 服务 器 程序 。 
temporal compression (时 间 压 缩 ) MPEG 中 对 
帧 的 压缩 。 

temporal logic (时 态 逻 辑 ) 一 种 在 推理 过 程 中 
包含 了 时 间 的 变化 和 影响 的 逻辑 。 

temporal masking (时 域 掩蔽 ) 高 音 削 弱 了 较 高 
音 的 影响 的 过 程 。 

terminated state (终止 状态 ) 在 进程 管理 中 ， 
进程 完成 运行 的 状态 。 

testability ( 易 测 性 ) 一 种 软件 的 属性 ， 用 来 度量 
软件 作为 可 操作 的 系统 来 测试 时 的 难 易 程度 。 


testing phase (测试 阶段 ) 软件 生命 周期 中 用 来 
测试 软件 包 是 否 正 常 工作 的 阶段 。 

text (文本 ) 以 字符 存储 的 数据 。 

text editor (文本 编辑 器 ) 一 种 创建 和 维护 文本 
文件 的 软件 ， 例 如 Word 或 源 程序 编辑 器 。 

text file (文本 文件 ) 所 有 数据 以 字符 形式 存储 的 
文件 ， 与 二 进 制 文件 相对 。 

thresholding ( 阔 值 处 理 ) 图 像 分 割 中 使 用 的 一 
种 方法 ， 指 定 亮度 的 像素 点 被 选择 出 来 ， 然 后 
再 搜索 所 有 具有 相同 亮度 的 像素 点 。 

throughput (吞吐 率 ) 在 一 个 时 间 单 元 内 可 以 通 
过 的 数据 单元 的 数量 。 

ticket ( 票 ) 在 会 话 密 钥 分 发 时 ， 将 包含 Bob 的 
会 话 密 钥 的 加 密 信 息 发 送 给 Alice， 接 下 来 将 
信息 分 发 给 Bob。 

time sharing (分 时 ) 一 种 操作 系统 的 概念 ， 指 
多 个 用 户 在 同一 时 刻 同时 访问 一 台 计算 机 。 

token ( 助 记 符 ) 一 种 表示 运算 、 标 志 位 或 一 块 
数据 的 语法 结构 。 

topology (拓扑 ) 包括 了 设备 物理 布局 的 网 络 结构 。 

track (磁道) 磁盘 中 的 一 部 分 。 

trade secret (商业 机 密 ) 产品 需要 保密 的 信息 。 

trademark (商标 ) 标识 一 个 公司 的 产品 的 签名 
或 姓名 。 

traffic analysis (流量 分 析 ) 对 机 密 信 息 的 一 种 
攻击 ， 其 中 攻击 者 通过 监控 在 线 的 网 络 流量 得 
到 一 些 信息 。 

transaction file (事务 文件 ) 包含 了 用 来 改变 主 
文件 内 容 的 相关 过 渡 过 程 数 据 的 文件 。 

transfer time (传送 时 间 ) 用 来 表示 将 数据 从 磁 
盘 传 送 到 CPU/ 内 存 所 需 的 时 间 。 

transferability (可 移植 性 ) 软件 系统 的 一 种 品 
质 ， 指 把 系统 从 一 个 平台 移植 到 田 一 个 平台 的 
能 力 。 

translator (翻译 程序 ) 一 种 语言 转换 程序 的 通用 
术语 。 人 参见 assembler 和 compiler。 

Transmission Control Protocol ( TCP) (传输 控 
制 协议 ) TCP/IP 协议 族 中 的 传输 控制 层 协 议 
之 一 。 

transmission control protocol/Internet protocol 
(TCP/IP) (传输 控制 协议 / 网 际 协议 ) 因特网 
上 所 使 用 的 正式 协议 ， 该 协议 由 5$ 层 组 成 。 

transmission medium (传输 介质 ) 连接 两 个 通 
信 设 备 的 物理 路 径 。 
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transmission rate (传输 率 ) 每 秒 传输 的 位 数 。 

transposition cipher (调换 加 密 ) 调换 明文 中 的 
符号 顺序 而 形成 密 文 ， 反 之 亦 然 。 

traversal (遍历 ) 一 种 用 于 对 结构 中 所 有 元 素 进 
行 一 次 且 只 一 次 处 理 的 算法 。 

tree ( 树 ) 由 相互 连接 的 节点 集 组 成 ， 其 中 每 个 
节点 只 有 一 个 前 驱 节点 。 

Trojan horse (特洛伊 木马 ) 可 能 会 造成 恶意 行 
为 (例如 删除 文件 或 污染 文件 ) 的 程序 。 

True-color ( 真 彩 ) 在 光栅 图 形 中 用 24 位 表示 彩 
色 的 一 种 技术 。 

truncation error (截断 错误 ) 浮 点 表示 法 的 数字 
在 存储 时 发 生 的 一 种 错误 ， 存储 的 数字 值 可 能 
不 如 想象 中 的 准确 。 

truth table ( 真 值 表 ) 该 表 列 出 了 所 有 可 能 输入 
的 逻辑 值 的 组 合 及 其 相对 应 的 逻辑 输出 。 

tuple (元 组 ) 关系 数据 库 中 ， 关 系 的 一 个 记录 
(一 行 )。 

Turing machine (图 灵机 ) 一 种 含有 三 个 部 件 的 
计算 机 模型 (包括 磁带 、 控 制 器 和 读 / 写 头 )， 
它 可 以 实现 计算 机 语言 中 的 语句 。 

Turing model (图 灵 模 型 ) 基于 阿兰 : 图 灵 计 算 
机 理论 定义 的 计算 机 模型 。 

Turing test (图 灵 测 试 ) 由 阿兰 . 图 灵 设 计 的 
一 种 测试 ， 用 来 判断 计算 机 是 否 具有 真正 的 
智能 。 

twisted-pair cable ( 双 绞 线 ) 在 网 线 线 皮 内 缠绕 
在 一 起 的 两 根 绝 缘 电 缆 。 

tweet ( 短 消息 ，tweet) 在 Twitter 上 用 户 间 交 流 
的 短 消息 (不 超过 140 个 字符 )。 发 送 tweet。 

Twitter ( 推 特 ，Twitter) 一 个 流行 的 社交 网 络 ， 
用 户 可 以 发 布 叫 作 tweet 的 短 消息 。 

two-dimensional array (二 维 数组 ) 该 数组 中 元 
素 具 有 两 级 索引 。 参 见 multidimensional array。 

two’s complement (二 进 制 补 码 ) 一 种 二 进 制 数 
表示 方法 ， 其 中 补 码 通 过 对 其 所 有 位 取 反 后 加 
1 得 到 。 

two’s complement representation (二 进 制 补 码 
表示 法 ) 一 种 整数 的 表示 方法 ， 其 负数 的 表 
示 是 通过 将 其 正 数 的 原 码 中 从 最 右边 的 0 开始 
到 出 现 第 一 个 1 之 间 的 位 保持 不 变 ， 而 其 余 位 
取 反 。 

unary operation (一 元 操作 ) 该 操作 只 需要 一 个 
操作 数 。 


underflow (下 滋 ) 该 事件 发 生 在 从 一 个 空 数据 


结构 中 删除 数据 。 
undirected graph (无 向 图 ) 一 种 只 含有 边 的 图 ， 
也 就 是 说 该 图 中 节点 间 的 连 线 没 有 方向 。 


unfollow〈 取 消 关 注 ) 用 户 停止 跟随 Twitter 上 其 
他 用 户 的 过 程 。 

unguided media (无 线 介质 ) 不 受 物 理 边界 控制 
的 传输 介质 。 

Unicode (统一 字符 编码 标准 ) 32 位 字符 编码 ， 
其 中 包含 了 世界 上 绝 大 多 数 语言 的 符号 和 字母 。 

Unified Modeling Language (UML) (统一 建 模 语 
言 ) 一 种 用 于 分 析 和 设计 的 图 形 化 语言 。 

Uniform Resource Locator (URL) (统一 资源 定 
位 符 ) 一 个 字符 串 ， 用 来 标识 因特网 中 的 一 
个 页 面 。 

union operation (并 操作 ) 一 种 基于 两 个 集合 的 
操作 ， 操 作 的 结果 合并 了 两 个 集合 中 的 所 有 元 
素 ， 并 将 重复 元 素 去 除 。 

universal serial bus (USB) (通用 串 行 总 线 ) 一 
种 串 行 IO 设备 控制 器 ， 它 将 如 鼠标 、 键 盘 之 
类 的 慢 速 设备 和 计算 机 连接 起 来 。 

UNIX (UNIX 操作 系统 ) 一 种 在 计算 机 程序 员 和 
计算 机 科学 家 中 流行 的 操作 系统 。 

unsigned integer (无 符号 整数 ) 一 种 没有 符号 
的 整数 ， 它 的 值 范围 为 0 到 正 无 穷 大 。 

unsolvable problem (不 可 解 问 题 ) 计算 机 所 不 
能 解决 的 问题 。 

update operation (更 新 操作 ) 在 关系 数据 库 中 
的 一 种 改变 元 组 值 的 操作 。 

use case diagram (用 例 图 ) 在 UML 中 ， 显 示 
系统 用 户 视图 的 图 。 

user agent (UA) (用 户 代理 ) SMTP 协议 的 一 个 
组 成 部 分 ， 它 准备 消息 、 创 建 信封 和 把 消息 装 
人 信封 。 

user datagram (用 户 数据 报 ) 在 UDP 协议 中 使 
用 的 数据 单元 名 称 。 
User Datagram Protocol (UDP) (用 户 数 据 报 协议 ) 
一 种 在 TCP/IP 协议 族 中 的 传输 层 协议 之 一 。 
user interface (用 户 界 面 ) 一 种 能 够 接受 用 户 
(或 过 程 ) 请 求 的 程序 ， 并 将 其 解释 给 操作 系统 
的 其 他 部 分 进行 处 理 。 

user page (用 户 页 面 ) Facebook 的 主页 。 

User page (用 户 页 面 ) 用 户 页 面 是 你 在 Facebook 
上 使 用 的 主页 。 


454 大 语 并 


users (用 户 ) 在 DBMS 术语 中 ， 获 取 数 据 库 的 
每 一 个 实体 。 

utility (工具 ) UNIX 中 的 应 用 程序 。 

utilization (使 用 ) 道德 的 准则 ， 如 果 一 个 行为 会 
带 来 好 的 结果 ， 那 么 它 是 合法 的 。 

utilization (使 用 ) 道德 的 第 二 条 理论 ， 和 行为 
带 来 的 后 果 相 关 。 如 果 一 个 行为 会 带 来 好 的 结 
果 ， 那 么 它 是 合法 的 。 

variable (变量 ) 它 是 一 种 存储 在 内 存 中 的 对 象 ， 
该 对 象 的 值 能 够 在 程序 执行 过 程 中 变化 。 相 对 
于 常量 。 

vector graphic (矢量 图 ) 一 种 图 ， 该 图 中 的 线 
段 和 曲线 通过 数学 公式 来 定义 。 

verifying algorithm (验证 算法 ) 验证 数字 签名 合 
法 性 的 一 种 算法 。 

vertex (顶点 ) 图 中 的 一 种 节点 。 

vi ( vi) 在 Unix 操作 系统 中 可 以 使 用 的 屏幕 文本 
编辑 器 。 

video (视频 ) 图 像 ( 称 为 帧 ) 的 实时 显示 。 

virtual memory (虚拟 内 存 ) 内 存 组 织 的 一 种 形 
式 ， 这 种 形式 允许 程序 在 内 存 和 磁性 存储 之 间 
使 用 交换 技术 以 使 得 用 户 在 使 用 的 过 程 中 感觉 
内 存 比 实际 物理 内 存 要 大 。 

virus (病毒 ) 在 其 他 程序 中 隐藏 的 不 希望 获得 的 
程序 ， 可 以 自我 复制 。 

von Neumann model ( 汉 . 诺 依 曼 模型 ) 一 种 计 
算 机 模型 (包括 存储 器 、 算 术 逻 辑 单元 、 控 制 
单元 、 输 入 / 输出 子 系统 )， 现 代 计算 机 正 是 基 
于 此 模型 结构 。 

waiting state (等 待 状态 ) 一 种 用 于 表示 进程 等 
待 CPU 空闲 后 对 其 进行 处 理 的 等 待 状态 。 

waterfall model (瀑布 模型 ) 一 种 软件 开发 模型 ， 
要 求 在 一 个 模块 开发 全 部 完成 之 后 再 开始 下 一 
个 模块 的 开发 。 

Web (万 维 网 ) 参见 world wide web。 

Web page (网 页 ) 一 种 能 够 在 网 站 上 提供 超 文 


本 和 超 媒 体 的 单元 。 

well-known port number (知名 端口 号 ) 定义 网 
络 中 的 一 个 过 程 的 端口 号 。 

white box testing ( 白 盒 测试 ) 一 种 程序 测试 方 
法 ， 它 通过 考虑 程序 内 部 设计 来 测试 程序 。 也 
称 为 玻璃 盒 测 试 。 相 对 于 黑 盒 测 试 。 

wide area network ( WAN ) (广域网 ) 一 种 覆盖 
地 理 范 围 相 对 较 广 的 网 络 。 

WiMax ”全 球 互联 接 人 。 

Windows 2000 (Windows 2000 操作 系统 ) Windows 
NT 操作 系统 的 一 个 版 本 。 

Windows NT ( Windows NT 操作 系统 ) 由 微软 
开发 替换 MS-DOS 的 操作 系统 。 

Windows XP (Windows XP 操作 系统 ) Windows 
NT 操作 系统 的 一 个 版 本 。 

working directory (工作 目录 ) 当前 正在 使 用 的 
目录 。 

world wide web ( WWW) (万 维 网 ) 一 种 多 媒体 
因特网 服务 ， 它 使 得 用 户 可 以 通过 链接 在 因 特 
网 中 浏览 不 同 的 文档 。 

Worldwide Interoperability Access (全 球 互 联接 
人 ) DSL 或 天 线 和 因特网 连接 的 无 线 版 本 。 
worm (蠕虫 ) 活动 于 网 络 中 的 一 种 独立 的 程序 ， 

可 以 进行 自我 复制 。 

write once, read many( WORM ) ( 写 一 次 ， 读 多 
次 ) CD-R 的 另 一 个 名 字 。 

X.509 XX.509 是 使 用 结构 化 方式 描述 证 书 的 一 种 
方式 。 它 使 用 一 个 名 为 ASN.1 的 著名 协议 ， 这 
个 协议 定义 了 计算 机 程序 员 熟 悉 的 领域 。 

XOR operation ( 异 或 运算 ) 一 种 位 逻辑 运算 ， 
其 运算 规则 为 当 其 中 任 一 操作 数 为 1 时 运算 结 
果 为 1。 

zero-knowledge authentication ( 零 知识 身份 验 
证 ) 一 种 实体 身份 验证 方法 ， 在 身份 验证 过 
程 中 申请 者 没有 显露 任何 危及 信息 机 密 性 的 
东西 。 


